Mengapa Membangun Ejen AI RAG di EdgeOne Makers
Platform ini menyediakan keupayaan pemprosesan fail, ingatan berpegang sesi untuk Q&A pelbagai pusingan, dan panggilan alat LLM untuk pengambilan — bina seni bina agen rag lengkap tanpa pangkalan data atau perkhidmatan vektor luaran.

Penyebaran Satu Perintah
Terapkan dengan `git push` untuk auto-penyebaran atau `edgeone makers deploy` melalui CLI — tiada Docker, tiada Kubernetes, tiada penyediaan pelayan.

Jalankan Ejen Terbina Dalam
Waktu operasi yang dikendalikan dengan penghalaan sesi melekat, sehingga 1 jam waktu pelaksanaan, dan penggunaan semula keadaan dalam memori — dibina khas untuk panggilan LLM dan gelung ejen berbilang langkah.

Model AI Terintegrasi
Akses DeepSeek, MiniMax, Hunyuan, dan banyak lagi melalui pintu gerbang AI yang bersatu. Akaun baru menerima 500K token percuma tanpa konfigurasi.

Penglihatan Penuh
Penjejakan teragih tanpa instrumentasi — lihat rantaian panggilan lengkap, interaksi LLM, pemanggilan alat, dan metrik latensi dalam papan pemuka tempatan dan awan.
Cara Membina Ejen RAG AI dalam 3 Langkah
Proses dokumen menjadi pangkalan pengetahuan, definisikan alat pengambilan, dan sebarkan - platform mengendalikan memori, penghalaan, dan orkestra LLM untuk chatbot pangkalan pengetahuan anda.

1
Tulis Ejen Anda
Bina dalam direktori `agents/` dengan sebarang rangka kerja (OpenAI SDK, Claude SDK, LangGraph, CrewAI, DeepAgents).
2
Penyebarkan ke Pengeluaran
Tolak ke Git (GitHub/GitLab/Gitee) untuk auto-deploy, atau jalankan `edgeone makers deploy` melalui CLI.
3
Siarkan Secara Langsung
Disebarkan secara global dalam beberapa minit dengan SSL automatik dan penghalaan tepi.
Kefungsian Platform untuk Ejen AI RAG
Bagaimana EdgeOne Makers membolehkan ejen rag ai anda — penyimpanan fail untuk pangkalan pengetahuan, panggilan alat untuk pengambilan, ingatan sesi untuk Q&A multi-putaran, dan corak rag ejen ai.
Feature | Description |
|---|---|
| Jalankan Ejen | Menghos panggilan LLM, orkestra gelung Ejen, dan logik perniagaan, dengan penghalaan berasaskan sesi dan penskalaan automatik. |
| Alat Sandbox | Menyediakan dua lapisan API yang berasingan tetapi boleh bekerjasama untuk LLM dan pemaju. Automasi penyemak imbas, pelaksanaan kod, Shell, dan operasi fail semuanya berjalan dalam persekitaran sandbox yang terasing. |
| Penyimpanan Perbualan | Menyediakan pengurusan memori yang serasi dengan rangka kerja, dengan API bersatu untuk sesi dan mesej. |
| Pengamatan | Secara automatik mengumpul jejak panggilan dengan instrumen tanpa gangguan, membolehkan paparan jejak bersatu di papan pemuka tempatan dan awan. |
| Model terbina dalam | Akses Hunyuan dan model-model Cina arus perdana lain melalui AI Gateway dengan kuota token percuma untuk masa terhad. |
Keupayaan platform apa yang saya perlukan untuk ejen rag ai?
Penyimpanan/pemprosesan fail untuk pangkalan pengetahuan, pemanggilan alat LLM (cari + ambil) untuk pengambilan, dan memori yang melekat pada sesi untuk konteks multi-turn. EdgeOne Makers menyediakan ketiga-tiganya — membolehkan seni bina rag ejen tanpa perkhidmatan luaran.
Adakah saya memerlukan pangkalan data vektor untuk membina chatbot pangkalan pengetahuan?
Tidak. Sistem fail platform dan pemanggilan alat membolehkan seni bina ejen rag ringan — proses PDF kepada teks terstruktur, definisikan alat carian/ambil, dan biarkan LLM mendapatkan halaman yang relevan. Tiada Pinecone atau Weaviate diperlukan.
Bagaimana ingatan sesi membantu agen rag ai saya?
Penghalaan yang mengekalkan sesi memastikan konteks perbualan chatbot pangkalan pengetahuan anda kekal hidup merentasi pelbagai soalan — ejen mengingati apa yang telah dibincangkan dan dapat memperhalusi jawapan tanpa perlu mengambil semula.
Adakah membina ejen ai tanpa rag di EdgeOne Makers?
Ya. 500K token model/bulan, penyimpanan fail tetap, memori sesi yang melekat, dan sokongan perbualan berbilang pusingan — semua komponen untuk ejen ai rag pada kos sifar.
Bolehkah saya menyesuaikan logik pengambilan dalam ejen rag ai saya?
Ya. Anda menentukan fungsi alat anda sendiri (cari, ambil, tapis) — platform menyediakan runtime dan akses LLM. Bina sebarang corak seni bina ejen rag: kata kunci, semantik, hibrid, atau tersuai.