AI Chatbots Architecture

🗒️ Description

Chatboty nowej generacji oparte na LLM (Large Language Models) prowadzą naturalne, kontekstowe rozmowy. Nie są ograniczone do sztywnych scenariuszy — rozumieją intencje, adaptują się do kontekstu i wykonują akcje.

LLM vs tradycyjne chatboty

Cecha	Tradycyjne	LLM-based
Logika	Sztywne decision trees	Naturalne zrozumienie języka
Zapytania	Rozpoznawanie słów kluczowych	Kontekstowe odpowiedzi
Pamięć	Brak	Pamięć konwersacji
Akcje	Ograniczone	Function calling (booking, search)
Elastyczność	Tylko przewidziane scenariusze	Obsługa nieoczekiwanych zapytań

🧩 RAG Pipeline

RAG (Retrieval Augmented Generation) — zamiast trenować model na swoich danych, podajemy mu kontekst w runtime.

Pipeline krok po kroku

Chunking — podział dokumentów na fragmenty 500-1000 tokenów
Embedding — wektoryzacja chunków (OpenAI ada-002)
Vector DB — zapis do bazy wektorowej (Qdrant)
Semantic search — przy zapytaniu: wyszukanie top N relevantnych chunków
LLM context — podanie chunków jako kontekst dla modelu

Zalety RAG nad fine-tuningiem

Aktualizacja wiedzy bez kosztownego retreningu
Niższe koszty operacyjne
Kontrola nad źródłami odpowiedzi (traceability)
Możliwość wskazania skąd pochodzi informacja

Źródła bazy wiedzy

FAQ, dokumentacja produktu
Artykuły blogowe, polityki firmy
Dowolne dokumenty tekstowe

⚡ Function Calling

Chatbot może wykonywać akcje w zewnętrznych systemach:

{
  "name": "book_meeting",
  "parameters": {
    "date": "2025-11-20",
    "time": "14:00",
    "email": "user@example.com"
  }
}

Flow: n8n wykrywa function call → integracja z Calendly/Google Calendar → confirmation dla użytkownika.

Typowe akcje:

Rezerwacja spotkań
Wyszukiwanie w bazie produktów
Kwalifikacja leadów
Transfer do konsultanta (graceful degradation)

🏗️ Architektura systemu

Backend workflow w n8n:

Webhook receive message
Load conversation context
Search knowledge base (RAG)
Call LLM (OpenAI GPT-4 / Claude 3.5 Sonnet)
Execute actions if needed (function calling)
Store conversation history
Return response

Modele LLM

Model	Zaleta	Koszt
OpenAI GPT-4	Najlepsza jakość odpowiedzi, function calling	~$0.01/1k tokens
Claude 3.5 Sonnet	Świetna analiza, 200k context window	~$0.003/1k tokens

🎙️ Voicebots

VAPI — platforma do voice AI:

Real-time voice conversations
Integracja z telefonią (infolinia)
Transfer do człowieka
Recording & transcription

Use cases:

Automatyczna infolinia 24/7
Kwalifikacja leadów przez telefon
Appointment booking
Customer support

💰 Costs

Setup (jednorazowo)

Przygotowanie bazy wiedzy: 1-2 tygodnie
Konfiguracja workflow: 1 tydzień
Testing: 1 tydzień
Razem: 3-4 tygodnie

Miesięczne koszty operacyjne (1000 rozmów)

Składnik	Koszt
n8n (self-hosted)	$0-20
OpenAI API	$30-50
Qdrant Cloud	$25
VAPI (voicebot, opcjonalnie)	$99
Razem	$150-200/mo

vs. 1 pracownik customer support: $2500-3500/mo

📊 Case Study — automation.house

Problem: Strona z wieloma ofertami (Note Taker, Lead Generator, etc.) — użytkownicy mieli trudności z wyborem.

Rozwiązanie: Context-based chatbot:

Zadaje pytania o potrzeby klienta
Rozumie kontekst biznesowy
Rekomenduje odpowiednie rozwiązania
Umawia konsultacje

Stack: n8n + OpenAI GPT-4o + Qdrant + Airtable

Wyniki:

40% wzrost engagement
25% więcej umówionych konsultacji
80% użytkowników kończy rozmowę z konkretną akcją

Best Practices

Jasny cel konwersacji — bot musi wiedzieć co ma osiągnąć
Graceful degradation — transfer do człowieka gdy bot nie wie
Krótkie odpowiedzi — nie generuj esejów
Personality — charakter zgodny z brandem
Testing — testuj z prawdziwymi użytkownikami

📒 Podsumowanie

Context-based chatboty to przyszłość customer experience:

Dostępność 24/7 z konsystentną jakością
Skalowalność przy niskim koszcie operacyjnym ( $150 - 200/ m o v s$ 2500-3500/mo za pracownika)
RAG zapewnia aktualną wiedzę bez retreningu modelu
Function calling umożliwia realne akcje (booking, search)
VAPI rozszerza chatboty o kanał głosowy

🔗 Zasoby

Qdrant — vector database for semantic search
OpenAI Embeddings — embedding API
VAPI — voice AI platform
n8n — workflow automation
Agentic Systems — szersza perspektywa agentowych systemów AI

Template: knowledge_note_info

🪴 Brain

Explorer

AI Chatbots Architecture

AI Chatbots Architecture

🗒️ Description

LLM vs tradycyjne chatboty

🧩 RAG Pipeline

Pipeline krok po kroku

Zalety RAG nad fine-tuningiem

Źródła bazy wiedzy

⚡ Function Calling

🏗️ Architektura systemu

Modele LLM

🎙️ Voicebots

💰 Costs

Setup (jednorazowo)

Miesięczne koszty operacyjne (1000 rozmów)

📊 Case Study — automation.house

Best Practices

📒 Podsumowanie

🔗 Zasoby

Graph View

Table of Contents

Backlinks