AI MCP integráció

sziasztok,

[OFF] a topic kicsit félrevezető, nem Prolog, nem Lisp. érdemes lenne ezeket kivenni a megnevezésből, vagy létrehozni egy AI/LLM topic-ot. [/OFF]

AI klienst/klienseket szeretnék integrálni MCP szerverrel/szerverekkel. kezdő vagyok a témában, hobbista, előfordulhat, hogy nem fogalmazok elég pontosan, vagy nem jól használok fogalmakat.

A CÉL: AI modeleknek hozzáférést biztosítani email fiók(ok)hoz, GDrive fájlokhoz, Google naptár(ak)hoz, és még egyéb erőforrásokhoz, ami menet közben felmerül, és hasznosnak tűnik. a hozzáférés írást, olvasást, létrehozás, törlést és egyéb ésszerű műveleteket takar. a végső cél rutinszerű, favágás jellegű napi rutinok kiszervezése AI asszisztens számára, pl. "olvasd át a mai emaileket, melyek tárgyában vagy szövegében szerepel a <tárgy> szó, foglald össze egy jegyzetben az ebben szereplő fontosabb fejleményeket, információt, ezt helyezd el egy GDoc fájlban dátummal, töltsd ki ezek alapján egy adott GSheet vonatkozó sorait, hozz létre ezek alapján egy naptárbejegyzést, küldj az ezek alapján összegyűjtött kulcsadatokról egy emailt egy bizonyos címre, írd meg egy adott Slack channel-be, ha készen van" stb.
mindezt felhőben szeretném futtatni, lehetőség szerint docker konténerekben, az LLM modeleket API-n keresztül hívva (ha nagyon muszáj, lokálisan futtatva). nem zárkózom el az előfizetésektől, de amíg kísérletezek, csak kisebb összeget áldoznék erre (5-20$).

AHOL TARTOK:
- vannak API kulcsaim OpenAI-hoz, Anthropic-hoz, Google AI Labs-hoz, jelenleg free plan korlátokkal. van Zapier fiókom.
- telepítettem docker-be LibreChat-et, Open-WebUI-t, LiteLLM-et, elérem a felsorolt szolgáltatók modeljeit, tudom őket használni.
- Zapier-ben létrehoztam MCP szerver(eke)t, felvettem tool-okat, létrehoztam action-öket.

AMI NEM SIKERÜL: összekötni a klienseket az MCP szerverrel (Zapier). megvan a kapcsolat linkje, felveszem pl. LiteLLM-be (streamable http, no auth), de nem látja a tool-okat. LibreChat-ben is létrehoztam egy asszisztens-t Zapier hozzáféréssel, tudok vele küldetni emailt a fiókomból, de ennél többre nem sikerült rávennem még. sem email olvasásra, sem cimkézésre pl.

AMIT SZERETNÉK: konkrét tapasztalatokat, mit hogyan érdemes. milyen model, milyen kliens, milyen proxy/bridge, milyen MCP szerver. ezeket konkrétan hogyan tudom integrálni. használható videókat, leírásokat, magyarul vagy angolul. nagyjából értem, mit hogyan lehet, kellene, de egyelőre elveszek a sok információban, elakadok a sok platform részleteiben, úgy vélem, olyasvalaki segítsége jönne most jól, akinek sikerült már összehoznia hasonlót, ismeri a buktatókat, képben van a korlátokkal, van konkrét tapasztalata.

előre is kösz.

Hozzászólások

Még nem próbáltam, csak sub, de ehhez hasonló dolgokat demóztak már a Google I/O-n. Elvileg elég csak simán előfizetni a Gemini AI Pro-ra, most az első hónap ingyen van. Aztán persze lehet, hogy az még csak USA only...

Miután "előfizettél", megjelenik majd a Gemini az összes Google alkalmazásodban (gmail, calendar, drive, etc. (és az Androidos telefonodon is)) és elvileg alapból fogja tudni mindazt amit szeretnél (a Google I/O alapján legalábbis). Slack: talán email küldéssel is lehet üzenni Slack-re és ezt is tudnia kellene a Gemini-nek. Meg talán létezik Zapier bővítmény a gmailhez, de nem tudom, hogy a Gemini azzal tud-e kezdeni valamit. Egy próbát megérhet, persze ha mindenáron MCP kell akkor ez az irány felejtős.

köszi a hozzászólást.

van mindenféle Gemini-m most is API-n keresztül, előfizetés nélkül. kiszedtem egy régi ingyenes project-ből egy kulcsot, és megy vele minden további nélkül. de ez csak a model, a személyes dolgaimhoz nyilván így nem fér hozzá.

a cél az lenne, hogy akárhonnan hozzáférjek, meg akármihez, ne csak Google app-ból, ne csak Google-höz, ezért (is) kéne az MCP. Zapier-ben van minden, gmail, slack, amit akarsz, ha a Zapier integráció menne fullosan, akkor menne minden. de ez a része pont, ami kicsit még zavaros meg döcögős.

pl. nem világos, hogy amikor összerakok egy Zap-et egy feladatra (most úgy tűnik, erre kell keresni a megoldást), akkor mi a trigger. webhook? mert az csak a fizetős Zapier-ben érhető el, úgy tűnik. vagy be lehet kötni valahogy másképp is chatbot request-et vajon?..

A Gemini előfizetés nélkül és a Pro az két külön világ. A Pro esetén minden Google termékben megjelenik a Gemini. Sheetben például fogsz tudni még a cellában is promptolni.

Egyszerű LLM + tucatnyi MCP szerintem nem fogja megoldani ezeket a komplex feladatokat amiket szeretnél, de mindenképpen érdekes kísérlet lehet. Gyors sem lesz, mire MCP-n keresztül kikeresgeti a keresővel releváns emailjeidet majd azokat egyesével átolvassa, és ezt minden alkalommal újrakezdi... Ez már inkább Agent jellegű feladat lenne, abból viszont minden egyes fentebb említett feladatodhoz neked kellene egy-egy agentet összeállítani/lekódolni. Ez többszintű, felül kell egy koordinátor ami tudja az összes részfeladatot, a bemenetet és az elvárt kimenetet, és kell legyen memóriája/állapota, ahová összegyűjti/tárolja a részfeladatok eredményeit. Egyrészt ezek alapján hoz döntést a tovább lépéről másrészt ezekből építi fel a következő részfeladathoz a promptokat. Aztán minden egyes részfeladathoz indít külön LLM kéréseket dinamikusan felpromtolva és majd azok fognak MCP-zni. Ez mind python (vagy no-code vagy akármi) kód. Aztán ezt lehet csavarni, lehet implementálni hosszútávú memóriát ami nem veszik el, vagy több ilyen koordinátort/agentet összefogni egy felsőbb szintűvel (multi agent), stb. Szerintem még mindenki csak szív ezzel az egésszel, azok könyvelhetnek el sikereket akik nagyon pontosan specifikálva egy adott feladatra állítanak össze ilyet. Ha nem jön be az egyszerű sima LLM + tucatnyi MCP, akkor ezek felé lehet érdemes elmozdulni: Amazon Bedrock, CrewAI, Agno, Camel, AutoGPT, AutoGen—Lets, SuperAGI, Superagent, LangGraph, LangChain & LlamaIndex, és még 100 másik. Vagy, előfizetsz a Pro-ra és elengeded az MCP-t. :-D

minden egyes fentebb említett feladatodhoz neked kellene egy-egy agentet összeállítani/lekódolni. Ez többszintű, felül kell egy koordinátor ami tudja az összes részfeladatot, a bemenetet és az elvárt kimenetet, és kell legyen memóriája/állapota, ahová összegyűjti/tárolja a részfeladatok eredményeit. Egyrészt ezek alapján hoz döntést a tovább lépéről másrészt ezekből építi fel a következő részfeladathoz a promptokat. Aztán minden egyes részfeladathoz indít külön LLM kéréseket dinamikusan felpromtolva és majd azok fognak MCP-zni.

amennyire jelenleg átlátom, ezek lennének a "Zap"-ek a Zapier-ben. no-code, ui-on összelegozható.

Igen, de neked ha jól értem, például az a feldat, hogy "olvassa át a leveleket x tárggyal"  - ha ezt nem specifikálod le, hogy csak az új leveleket, a már elolvasott leveleket meg jelölje olvasottnak, akkor - mivel nincs neki állapota - minden alkalommal újra és újra neki fog kezdeni az ÖSSZES levélből kikeresni a dolgokat. A fordított irány kéne valójában neked - egy új levélre triggerelődjön valami automatizmus.

Aztán, nem nagyon van a feladat valójában specifikálva. Jelenleg kellene egy nagyon konkrét szűk feladat amit megoldasz - ez lehet akár ez az emailes, akár valami más - és erre keresni eszközöket, aztán ezt a parkot bővíteni.

A no-code -nak is megvannak a maga hátrányai, ahogy a lambda-szerű működésnek is. Mivel ezeknek nincs perzisztenciája, emlékezete, stb, így fontos, hogy a feladat tervezésénél (és ezért fontos valójában a konkét feladat megfogalmazása!) bele kell tervezned a ráfutás védelmet, a repetitás védelmet (hogy újra ugyanazokon a listákon menjen végig újra meg újra meg újra), a duplikáció védelmet (kétszer jön meg ugyanaz a levél két különböző aliasra ami ugyanarra a fiókra mutat), stb.

Én nulladik feladatnak azt látom, hogy fel kell sorolni, hogy mire szeretnéd használni, mi az, amit támogatni akarsz. Ez eleinte feladatok nagyon szűk és specifikus köre lesz, de később - ahogy haladsz a tanulásban - ez bővíthető.

És egy jó tanács: felejtsd el a Zapiert és a képességeit. Először fogalmazd meg, mit szeretnél csinálni, majd ehhez keress eszközt. Attól, mert a Zapiert ismered, nem biztos, hogy ez lesz számodra a legmegfelelőbb eszköz. Lehet, hogy a Zapok jók lesznek erre, az is lehet, hogy nem. Lehet, hogy saját kódot kell írnod, mert bár a Zapier jó erre, csak fizetősben tudja, amit szeretnél, és nem akarsz rá költeni. De ezek már mind-mind implementációs részletek.

Blog | @hron84

valahol egy üzemeltetőmaci most mérgesen toppant a lábával 

via @snq-

jogos észrevételek, köszönöm.

- éppen azt próbálom, hogy az új email legyen a trigger, ha match-el bizonyos kulcsszóra a tárgyban.
- a konkrét feladatra szűkítés az lenne, hogy az emailben található tartalom alapján töltsön, vezessen egy GSheet táblát, konkrét oszlopokkal.
- bár ismerném a Zapier-t...
- elvileg egyből látom, ha olyan tool-t akarok behozni, ami csak pro-ban érhető el, de eddig csak a webhook trigger volt ilyen, azt szerintem tudom nélkülözni.

Szerkesztve: 2025. 06. 16., h – 11:24

Hasznalj n8n-t... Olyan mint egy felturbozott node-red es mar alapbol megvan hozza kismillio integracio - cdak a kulcsokat kell beletolnod. tudod helyben is futtani. Es tegyel ala egy memoriat is.

igen, ezt is nézegettem a Zapier mellett. azt hiszem a rövid trial periódus és a regisztrációkor megadandó bankkártya adatok voltak, amiért inkább a Zapier felé indultam el, illetve láttam egy videót, ami előnyben részesítette a Zapier-t a n8n-hez képest, de majd még nézegetem, hátha.