Templates en Context Blocks

De KB Search Agent gebruikt prompt templates op aipromptpower.com om de Knowledge Bases te doorzoeken. Elke template is opgebouwd uit componenten.

Template Group

Alle templates zitten in de group WATCH-KB-SEARCH (PTG_ID=26), gescheiden van de user-facing chatbot templates (CHATBOTS group).

Template Structuur

Elk template bestaat uit deze componenten (in volgorde):

  1. Text Block (KB_SEARCH_SYSTEM) — Systeeminstructies voor het LLM
  2. Context Block(s) — De KB-zoekblokken die chunks/samenvattingen ophalen
  3. Tag (vraag:input:handmatige_input) — Vereist voor AI-Toolbox compatibiliteit

Context Blocks

Context blocks bepalen welke KB wordt doorzocht en hoeveel chunks worden opgehaald:

Chunk Blocks (voor reguliere search)

CodeKnowledge BaseChunksMax Tokens
KBS_DOC_10 WATCH-DOCUMENTATION 10 3000
KBS_DOC_20 WATCH-DOCUMENTATION 20 6000
KBS_HELP_10 WATCH-ONLINE-HELP 10 3000
KBS_HELP_20 WATCH-ONLINE-HELP 20 6000
KBS_VIDEO_6 WATCH_VIDEOS 6 1800
KBS_VIDEO_12 WATCH_VIDEOS 12 3600
KBS_WIKI_20 WATCH-WIKI 20 6000

Summary Blocks (top 50, met vector ordering)

CodeKnowledge BaseSummariesGoal
KBS_DOC_SUMMARY WATCH-DOCUMENTATION 50 GENERAL
KBS_HELP_SUMMARY WATCH-ONLINE-HELP 50 GENERAL
KBS_VIDEO_SUMMARY WATCH_VIDEOS 50 GENERAL
KBS_WIKI_SUMMARY WATCH-WIKI 50 GENERAL

Full Summary Blocks (alle samenvattingen, zonder vector ordering)

CodeKnowledge BaseLimitOpmerking
KBS_DOC_SUMMARY_FULL WATCH-DOCUMENTATION 120 Dekt alle 111 bronnen
KBS_HELP_SUMMARY_FULL WATCH-ONLINE-HELP 127 Top 127 van 377 bronnen
KBS_VIDEO_SUMMARY_FULL WATCH_VIDEOS 10 Dekt alle 8 bronnen
KBS_WIKI_SUMMARY_FULL WATCH-WIKI 30 Dekt alle 25 bronnen

Let op: Bij number_chunks=0 wordt geen embedding-vector gebruikt en geen ordering toegepast. Dit wordt gecontroleerd door de systeeminstelling USE_WHOLE_KNOWLEGDE_BASE.

Modellen

TemplateModelReden
Reguliere templates (6x) Groq (MAS_ID=36) Snel en goedkoop
KB_SEARCH_SUMMARY_FULL Claude Sonnet 4.6 (MAS_ID=40) 1M context window voor grote hoeveelheid samenvattingen

Laatste nieuws

GPT-4o: Sneller en Goedkoper

Op 13 mei 2024 heeft OpenAI haar nieuwste model, GPT-4o, gelanceerd. Dit model belooft niet alleen twee keer zo snel te zijn als de huidige GPT-4 Turbo versie, maar ook aanzienlijk goedkoper.

Lees meer

SCHREEUWEN tegen je computer?

AI-ontwikkelingen suggereren dat we binnenkort misschien op verrassend menselijke manieren met onze apparaten kunnen communiceren. Helpt het om te schreeuwen tegen je AI-model?

Lees meer

Fooi geven aan ChatGPT kan leiden tot langere antwoorden

Het aanbieden van een fooi aan ChatGPT kan resulteren in langere antwoorden, volgens ontdekkingen van programmeur Theia Vogel.

Lees meer

Geef AI-modellen menselijke aanmoedigingen

Google DeepMind introduceert een nieuwe techniek genaamd OPRO om de wiskundekennis van AI-taalmodellen te verbeteren door middel van menselijke aanmoediging.

Lees meer