Как создать ИИ-агента: пошаговое руководство

Подробная инструкция по созданию AI-агента: от выбора модели до деплоя. Рассмотрим как code, так и no-code подходы.

25 минут чтения Обновлено: 06.12.2025

Обзор подходов к созданию ИИ-агента

Существует два основных пути создания ИИ-агента:

Code-подход

Программирование на Python/JavaScript с использованием фреймворков.

Плюсы:

  • Максимальная гибкость
  • Полный контроль над логикой
  • Легко масштабировать

Минусы:

  • Требует навыков программирования
  • Больше времени на разработку
Python LangChain LangGraph

No-code подход

Визуальные конструкторы типа n8n для быстрого создания агентов.

Плюсы:

  • Быстрый старт (часы вместо дней)
  • Не нужно программирование
  • Визуальная отладка

Минусы:

  • Ограничения сложной логики
  • Зависимость от платформы
n8n Flowise Dify

Наша рекомендация

Для большинства бизнес-задач рекомендуем n8n — оптимальный баланс между гибкостью и простотой. Если нужна сложная логика или высокие нагрузки — переходите на code-подход с LangChain.

Шаг 1: Определение задач агента

Прежде чем писать код или настраивать n8n, чётко сформулируйте:

Вопросы для определения задач

  1. Какую проблему решает агент? — Например: "Автоматическая квалификация входящих лидов"
  2. Кто будет взаимодействовать с агентом? — Клиенты, сотрудники, партнёры
  3. Через какие каналы? — Telegram, WhatsApp, сайт, API
  4. Какие действия должен выполнять? — Отвечать на вопросы, создавать записи, отправлять уведомления
  5. С какими системами интегрировать? — CRM, базы данных, календари

Пример описания агента

Агент: Ассистент по продажам недвижимости

Задачи:

  • Отвечать на вопросы клиентов в Telegram
  • Квалифицировать по бюджету, локации, типу недвижимости
  • Подбирать объекты из базы данных
  • Записывать на просмотры
  • Создавать сделки в Bitrix24

Интеграции: Telegram, PostgreSQL (база объектов), Bitrix24, Google Calendar

Шаг 2: Выбор LLM (языковой модели)

LLM — это "мозг" агента. Выбор зависит от задач, бюджета и требований к приватности.

GPT-5.1 (OpenAI)

Качество: ★★★★★

400K контекст, отличный function calling, мультимодальность. Работает до 24 часов автономно.

~$1.25-10 / 1M токенов
Универсальный выбор

Claude Opus 4.5

Качество: ★★★★★

80.9% SWE-bench, лидер в кодинге. Параметр effort для контроля качества/скорости.

~$5-25 / 1M токенов
Лучший для кодинга

Gemini 3 Pro

Качество: ★★★★★

Лидер в мультимодальных и научных задачах. Отличная визуальная обработка.

~$7 / 1M токенов
Мультимодальность

Grok 4 (xAI)

Качество: ★★★★★

2M токенов контекст, доступ к данным X в реальном времени. Быстрый inference.

~$5-15 / 1M токенов
Актуальные данные

Как выбрать модель?

  • Нужна максимальная приватность? → Ollama + Llama 4
  • Важен баланс цена/качество? → GPT-5.1 или Claude Sonnet 4.5
  • Работа с большими документами? → Grok 4 (2M контекст)
  • Минимальный бюджет? → Gemini 3 Flash или Groq (бесплатный tier)

Шаг 3: Настройка инструментов (Tools)

Инструменты позволяют агенту взаимодействовать с внешним миром. Без них агент — просто чат-бот.

Типы инструментов

Поиск информации

  • Web Search (Google, Bing)
  • Wikipedia
  • Vector Store (RAG)

Работа с данными

  • SQL-запросы к БД
  • Google Sheets
  • REST API

Коммуникации

  • Отправка email
  • Telegram/WhatsApp
  • Slack/Discord

Бизнес-системы

  • CRM (создание сделок)
  • Календарь (бронирование)
  • Helpdesk (тикеты)

Пример описания инструмента

Python (LangChain)
from langchain.tools import tool
from pydantic import BaseModel, Field

class SearchPropertiesInput(BaseModel):
    city: str = Field(description="Город для поиска")
    max_price: int = Field(description="Максимальная цена в рублях")
    rooms: int = Field(description="Количество комнат", default=None)

@tool("search_properties", args_schema=SearchPropertiesInput)
def search_properties(city: str, max_price: int, rooms: int = None):
    """Поиск объектов недвижимости по параметрам.
    Используй этот инструмент когда клиент спрашивает о
    доступных квартирах или хочет подобрать объект."""

    # Запрос к базе данных
    query = f"""
        SELECT * FROM properties
        WHERE city = '{city}'
        AND price <= {max_price}
        {f"AND rooms = {rooms}" if rooms else ""}
        LIMIT 5
    """
    results = db.execute(query)
    return format_properties(results)

Важно: описание инструмента

LLM решает, какой инструмент вызвать, на основе описания (docstring). Пишите чёткие описания: когда использовать, какие параметры, что возвращает. Плохое описание = агент не вызывает инструмент или вызывает не тот.

Шаг 4: Создание System Prompt

System Prompt — инструкции для агента. Это самая важная часть, определяющая поведение.

Структура хорошего промпта

  1. Роль и контекст — кто агент, для какой компании работает
  2. Цели — что должен достигать
  3. Правила поведения — что можно и нельзя делать
  4. Инструкции по инструментам — когда какой использовать
  5. Формат ответов — длина, стиль, структура
  6. Примеры — few-shot для сложных случаев

Шаблон System Prompt

System Prompt
# РОЛЬ
Ты — ИИ-ассистент компании "Премиум Риэлт", специализирующейся
на продаже квартир в Москве. Твоё имя — Алиса.

# ЦЕЛИ
1. Помогать клиентам найти подходящую недвижимость
2. Квалифицировать клиентов по бюджету и потребностям
3. Записывать заинтересованных клиентов на просмотры
4. Создавать сделки в CRM для менеджеров

# ПРАВИЛА ПОВЕДЕНИЯ
- Всегда начинай с приветствия и уточняющих вопросов
- Отвечай кратко, 2-3 предложения максимум
- Если не знаешь ответ — честно скажи и предложи связаться с менеджером
- НИКОГДА не называй конкретные цены без проверки в базе
- При агрессии — сохраняй спокойствие, предложи связаться с руководством

# ИСПОЛЬЗОВАНИЕ ИНСТРУМЕНТОВ
- search_properties: когда клиент называет бюджет/район/параметры
- schedule_viewing: когда клиент хочет посмотреть объект
- create_deal: после успешной записи на просмотр

# ФОРМАТ ОТВЕТОВ
- Русский язык
- Вежливый, но не слащавый тон
- Эмодзи — минимально, только если уместно
- Структурируй списки, если перечисляешь объекты

# ПРИМЕР ДИАЛОГА
Клиент: Ищу двушку до 15 млн
Агент: Понял! Подскажите, какой район Москвы рассматриваете?
       И важна ли близость к метро?

Шаг 5: Добавление памяти

Память позволяет агенту помнить контекст разговора и информацию о пользователе.

Типы памяти

Buffer Memory

Хранит всю историю диалога. Простая, но потребляет много токенов при длинных разговорах.

Для коротких сессий

Window Memory

Хранит последние N сообщений. Баланс между контекстом и расходом токенов.

Рекомендуется для большинства

Summary Memory

Сжимает историю в резюме. Экономит токены, но теряет детали.

Для очень длинных сессий

Vector Memory

Хранит в векторной БД, извлекает релевантное. Для долгосрочной памяти о пользователе.

Для персонализации

Реализация в Python

Python (LangChain)
from langchain.memory import ConversationBufferWindowMemory
from langchain_community.chat_message_histories import RedisChatMessageHistory

# Хранение в Redis для персистентности
def get_memory(session_id: str):
    message_history = RedisChatMessageHistory(
        session_id=session_id,
        url="redis://localhost:6379"
    )

    return ConversationBufferWindowMemory(
        memory_key="chat_history",
        chat_memory=message_history,
        k=10,  # Последние 10 сообщений
        return_messages=True
    )

# Использование
memory = get_memory(user_id="telegram_12345")
agent = create_agent(llm=llm, tools=tools, memory=memory)

Шаг 6: Тестирование и деплой

Чеклист тестирования

Базовые сценарии (happy path)
Edge cases (пустой ввод, очень длинные сообщения)
Провокационные вопросы (попытки jailbreak)
Обработка ошибок (API недоступен, таймаут)
Корректность вызова инструментов
Время отклика < 5 секунд
Работа памяти (контекст сохраняется)

Варианты деплоя

Docker + VPS

Самый гибкий вариант. Разверните на Hetzner, Selectel или любом VPS.

от 1000 ₽/мес

Serverless (AWS Lambda)

Платите только за использование. Хорошо для непредсказуемой нагрузки.

от $0 (free tier)

n8n Cloud

Managed solution, не нужно администрировать. Быстрый старт.

от €20/мес

No-code решение на n8n

Если не хотите программировать, n8n позволяет создать агента визуально:

Преимущества n8n для агентов

  • Визуальный редактор workflow
  • Встроенные AI-ноды (Agent, Memory, Tools)
  • 400+ интеграций из коробки
  • Self-hosted — полная приватность
  • Бесплатный open-source

Базовый агент в n8n

Telegram Trigger

Получение сообщения

AI Agent

+ Chat Model
+ Memory
+ Tools

Telegram Send

Отправка ответа

Хотите создать агента на n8n?

Подробное руководство по n8n AI Agent →

Часто задаваемые вопросы

Python — самый популярный выбор благодаря богатой экосистеме (LangChain, OpenAI SDK). JavaScript/TypeScript тоже подходят (LangChain.js). Для no-code решений подойдёт n8n — там вообще не нужно программирование.

Зависит от модели и нагрузки. GPT-5.1: ~$1.25-10 за 1 млн токенов. Claude Sonnet 4.5: ~$3-15 за 1 млн токенов. Для небольшого бота с 1000 диалогов/месяц — около $10-30. Локальные модели (Ollama) — бесплатно, но нужен сервер.

Да, есть альтернативы: Anthropic Claude, Google Gemini, xAI Grok, Groq (бесплатный tier). Для полной независимости используйте Ollama с локальными моделями (Llama 4, Mistral) — работают на вашем сервере.

Создайте набор тестовых сценариев, включая edge cases и провокационные вопросы. Проверьте: 1) Качество ответов, 2) Корректность вызова инструментов, 3) Обработку ошибок, 4) Время отклика. Используйте A/B тестирование промптов.

Ключевые методы: 1) Детальный system prompt с примерами, 2) RAG с качественной базой знаний, 3) Few-shot примеры в промпте, 4) Fine-tuning на ваших данных (для enterprise), 5) Регулярный анализ логов и обновление промптов.

Хотите создать ИИ-агента, но нет времени?

Мы разрабатываем AI-агентов под ключ: от анализа задач до внедрения и поддержки. Быстрее и надёжнее, чем делать самостоятельно.

0 просмотров