CopilotKit: పూర్తి స్టాక్ AI ఏజెంట్, జనరేటివ్ UI మరియు చాట్ అప్లికేషన్స్ కోసం టాప్ SDK
CopilotKit: పూర్తి స్టాక్ AI ఏజెంట్, జనరేటివ్ UI మరియు చాట్ అప్లికేషన్స్ కోసం టాప్ SDK
నేపథ్య సమీక్ష
CopilotKit అనేది AI Copilot మరియు Agent-native అప్లికేషన్స్ నిర్మించడానికి ప్రత్యేకంగా రూపొందించిన ఓపెన్ సోర్స్ ఫ్రేమ్వర్క్, GitHub స్టార్ సంఖ్య 28.9k కంటే ఎక్కువ, 100,000 కంటే ఎక్కువ డెవలపర్ల ద్వారా స్వీకరించబడింది. ఈ ఫ్రేమ్వర్క్ యొక్క ప్రధాన విలువ AI ఏజెంట్ను వినియోగదారు ఇంటర్ఫేస్తో లోతుగా సమీకరించడం, ఏజెంట్కు UIని రియల్ టైమ్లో నియంత్రించడానికి, సందర్భ సమాచారాన్ని అందించడానికి మరియు జనరేటివ్ UI ద్వారా డైనమిక్గా ఇంటర్ఫేస్ భాగాలను చిత్రీకరించడానికి అనుమతించడం.
ప్రధాన కనుగొనడాలు
1. నిర్మాణ డిజైన్ మరియు ప్రధాన ఫంక్షన్లు
CopilotKit మూడు స్థాయి నిర్మాణ డిజైన్ను ఉపయోగిస్తుంది, ఇది ఫ్రంట్-ఎండ్ భాగాలు, CopilotRuntime రన్టైమ్ స్థాయి మరియు ఏజెంట్ కనెక్షన్ స్థాయిని కలిగి ఉంది.
ఫ్రంట్-ఎండ్ భాగాలు పూర్తిగా హెడ్లెస్ UI నుండి ముందుగా నిర్మించిన కస్టమైజ్ చేయగల భాగాల పూర్తి స్పెక్ట్రమ్ను అందిస్తాయి, డెవలపర్లు అవసరానికి అనుగుణంగా సులభంగా ఎంపిక చేసుకోవచ్చు. CopilotRuntime బ్యాక్ఎండ్ ఆర్డినేషన్ ఇంజిన్గా పనిచేస్తుంది, ఇది ఫ్రంట్-ఎండ్ క్లయింట్ నుండి వచ్చిన అభ్యర్థనలను నిర్వహిస్తుంది, LLM కాల్లను నిర్వహిస్తుంది మరియు ఏజెంట్ పరస్పర చర్యను నిర్వహిస్తుంది. ఏజెంట్ కనెక్షన్ స్థాయి AG-UI ప్రోటోకాల్ ద్వారా ఏదైనా ఏజెంట్ ఫ్రేమ్వర్క్ను కనెక్ట్ చేస్తుంది, అందులో LangGraph, CrewAI, LlamaIndex మొదలైనవి ఉన్నాయి.
CopilotKit యొక్క ప్రధాన లక్షణాలు జనరేటివ్ UI (Generative UI), ఇది ఏజెంట్కు రన్టైమ్లో డైనమిక్గా UI భాగాలను చిత్రీకరించడానికి అనుమతిస్తుంది; షేర్ చేసిన స్థితి (Shared State), ఇది ఫ్రంట్-ఎండ్ మరియు ఏజెంట్ మధ్య ద్వి-దిశ స్థితి సమకాలీకరణను సాధిస్తుంది; మరియు హ్యూమన్-ఇన్-ది-లూప్ (Human-in-the-Loop), ఇది ఏజెంట్ను అమలు ప్రక్రియలో మానవ ఇన్పుట్ లేదా ఆమోదాన్ని కోరడానికి మద్దతు ఇస్తుంది. ఈ లక్షణాలు నిజంగా పరస్పర చర్య కలిగిన AI అప్లికేషన్స్ను నిర్మించడం సాధ్యం చేస్తాయి, కేవలం సాధారణ ప్రశ్న-సమాధాన వ్యవస్థలు కాకుండా.
పని ప్రవాహం ఉదాహరణ:
2. AG-UI ప్రోటోకాల్: పర్యావరణ వ్యవస్థ యొక్క పునాది
AG-UI (ఏజెంట్-యూజర్ ఇంటరాక్షన్ ప్రోటోకాల్) అనేది CopilotKit బృందం విడుదల చేసిన ఓపెన్, తేలికపాటి, ఈవెంట్-డ్రైవన్ ప్రోటోకాల్ ప్రమాణం, ఇది AI ఏజెంట్ మరియు వినియోగదారుల దిశగా అప్లికేషన్స్ మధ్య కమ్యూనికేషన్ పద్ధతులను ప్రమాణీకరించడానికి ఉద్దేశించబడింది. ఈ ప్రోటోకాల్ Google, Microsoft, AWS, LangChain, Mastra, Pydantic AI వంటి ప్రధాన సంస్థలు మరియు ఫ్రేమ్వర్క్ల ద్వారా విస్తృతంగా స్వీకరించబడింది, ఇది పెరుగుతున్న పర్యావరణ వ్యవస్థను ఏర్పరుస్తుంది.
AG-UI ప్రోటోకాల్ ఒక కీలక సమస్యను పరిష్కరిస్తుంది: సంప్రదాయ ఫ్రంట్-ఎండ్ మరియు బ్యాక్-ఎండ్ కమ్యూనికేషన్ మోడల్ (అభ్యర్థన-సమాధానం) ఏజెంట్ అప్లికేషన్స్ యొక్క సంక్లిష్ట అవసరాలను తీర్చలేకపోతుంది. ఏజెంట్కు రియల్ టైమ్లో స్థితి నవీకరణలను ప్రసారం చేయడం, ప్రాసెస్ విరామాలు మరియు ఆమోద ప్రక్రియలను నిర్వహించడం, UI మరియు ఏజెంట్ స్థితిని సమకాలీకరించడం అవసరం, ఇవన్నీ మరింత సౌలభ్యమైన కమ్యూనికేషన్ యంత్రాంగాన్ని అవసరం చేస్తాయి. AG-UI ఈ ఫంక్షన్లను ఈవెంట్ స్ట్రీమింగ్ ద్వారా సాధించింది, ఇది రియల్ టైమ్ టెక్స్ట్ స్ట్రీమ్, టూల్ కాల్స్, స్థితి సమకాలీకరణ మరియు కస్టమ్ ఈవెంట్లను మద్దతు ఇస్తుంది.
ప్రస్తుతం ఏజెంట్ ప్రోటోకాల్ రంగంలో మూడు ప్రధాన స్తంభాలు ఉన్నాయి: AG-UI వినియోగదారులతో ఏజెంట్ పరస్పర చర్య స్థాయిపై దృష్టి సారిస్తుంది, MCP (మోడల్ కాంటెక్స్ట్ ప్రోటోకాల్) ఏజెంట్ మరియు టూల్లు మరియు డేటా మధ్య కనెక్షన్ను నిర్వహిస్తుంది, మరియు A2A (ఏజెంట్-టు-ఏజెంట్) ఏజెంట్ల మధ్య సమన్వయ కమ్యూనికేషన్ను నిర్వహిస్తుంది. గమనించదగ్గ విషయం ఏమిటంటే, AG-UI A2A ప్రోటోకాల్తో హ్యాండ్షేక్ ఇంటిగ్రేషన్ను సాధించింది మరియు జనరేటివ్ UI చిత్రీకరణ కోసం Google యొక్క A2UI ప్రమాణాన్ని పూర్తిగా మద్దతు ఇస్తుంది.
3. ప్రధాన ఫ్రేమ్వర్క్లతో సమీకరణCopilotKit 与 LangGraph 的集成是最成熟的用例之一。通过简单的配置,开发者即可将 LangGraph 代理连接到 CopilotKit 前端,实现状态共享和实时流式响应。集成过程通常包括使用 useCoAgent hook 连接代理,通过 copilotkitemitstate 函数从代理端发射状态更新,以及使用 useCopilotAction 定义人机协作中断点。
对于 CrewAI 开发者,CopilotKit 同样提供了开箱即用的集成方案。通过 AG-UI 协议,开发者可以将任何 CrewAI 代理暴露为支持实时交互的前端应用。除 LangGraph 和 CrewAI 外,AG-UI 协议还支持 Microsoft Agent Framework、Google ADK、AWS Strands Agents、Mastra、Pydantic AI、Agno、LlamaIndex 等众多框架,形成了真正的多框架互操作性。
4. 与同类框架的对比分析
与 Vercel AI SDK 相比,CopilotKit 的定位有显著差异。Vercel AI SDK 主要专注于简化聊天界面的流式文本传输,提供了优秀的 useChat hook 和 UI 组件;而 CopilotKit 更强调深度代理集成、生成式 UI 和人机协作能力。
与 LangChain 的关系则更像是互补而非竞争。LangChain 侧重于构建代理的"大脑"(逻辑和工作流),而 CopilotKit 提供该大脑的"面孔、声音和双手"——即与应用交互的界面。开发者通常使用 LangChain/LangGraph 定义代理逻辑,然后通过 CopilotKit 构建用户交互层。
5. 典型应用场景
CopilotKit 的典型用例涵盖多个领域。SaaS Copilot 是其最常见的应用场景,智能助手可以引导用户完成复杂的工作流程,提供上下文感知的帮助。共创 Copilot 则强调人机协作,AI 与用户共同创建内容,显著提升生产力。对话式表单填写将繁琐的表单转化为自然对话交互,用户通过聊天即可完成复杂的数据输入。研究代理应用如官方演示的研究画布应用,展示如何将 LangGraph 代理与前端深度集成,实现研究大纲生成、章节撰写和人类审批的完整流程。
快速入门:代码示例
基础集成示例
以下是一个使用 CopilotKit 与 LangGraph 集成的最小可运行示例:
前端(Next.js/React):
// app/page.tsx "use client"; import { CopilotKit } from "@copilotkit/react-core"; import { CopilotPopup } from "@copilotkit/react-ui"; import "@copilotkit/react-ui/styles.css";
export default function Home() { return (
研究助手
); }运行时 API 路由:
// app/api/copilotkit/route.ts import { CopilotRuntime, OpenAIAdapter } from "@copilotkit/runtime"; import { NextRequest } from "next/server";const copilotKit = new CopilotRuntime({ remoteEndpoints: [ { url: process.env.LANGGRAPHURL || "http://localhost:8000" }, ], });
const serviceAdapter = new OpenAIAdapter();
export const POST = async (req: NextRequest) => { const { handleRequest } = copilotKit; return handleRequest(req, { serviceAdapter }); };
共享状态示例
// useCoAgent ను ఉపయోగించి ముందు మరియు వెనుక స్థితి సమకాలీకరణను అమలు చేయండి import { useCoAgent } from "@copilotkit/react-core";
function ResearchCanvas() { const { state, setState } = useCoAgent({ name: "researchagent", initialState: { topic: "", outline: [], currentSection: null, }, });
return (
setState({ ...state, topic: e.target.value })} placeholder="అన్వేషణ అంశాన్ని నమోదు చేయండి" />
); }
人机协作(Human-in-the-Loop)示例
import { useCopilotAction } from "@copilotkit/react-core";
function DocumentEditor() { useCopilotAction({ name: "publishDocument", description: "ప్రచురణకు ముందు డాక్యుమెంట్ను వినియోగదారు నిర్ధారించాలి", parameters: [ { name: "title", type: "string", description: "డాక్యుమెంట్ శీర్షిక" }, { name: "content", type: "string", description: "డాక్యుమెంట్ కంటెంట్" }, ], handler: async ({ title, content }) => { const confirmed = await new Promise((resolve) => { showConfirmDialog({ title, content, onConfirm: resolve }); });
if (confirmed) { await api.publish({ title, content }); return "డాక్యుమెంట్ విజయవంతంగా ప్రచురించబడింది"; } return "ప్రచురణ రద్దు చేయబడింది"; }, });
return ...; }`
典型应用案例
案例 1:SaaS 智能助手
场景:ఒక సంస్థ స్థాయి ప్రాజెక్ట్ నిర్వహణ సాధనం, వినియోగదారులకు త్వరగా పనులను సృష్టించడానికి, వనరులను కేటాయించడానికి, నివేదికలను రూపొందించడానికి AI సహాయకుడిని సమీకరించడం.
实现要点:
- CopilotKit యొక్క పంచుకున్న స్థితి ఫంక్షన్ను ఉపయోగించి, AI ప్రస్తుత ప్రాజెక్ట్ దృశ్యాన్ని实时గా తెలుసుకోవడం
- జనరేటివ్ UI ద్వారా పనుల కార్డులు, గాంట్ చార్ట్ వంటి భాగాలను డైనమిక్గా చిత్రించడం
- కీలక కార్యకలాపాలను (ఉదాహరణకు, ప్రాజెక్ట్ తొలగించడం) వినియోగదారు నిర్ధారించాల్సిన మానవ-యంత్ర సహకార నోడ్లువినియోగదారులు సహజ భాష ద్వారా సంక్లిష్టమైన కార్యకలాపాలను పూర్తి చేయవచ్చు, ఉదాహరణకు "నాకు వచ్చే వారంలో ముగియబోయే పనిని ఫ్రంట్ ఎండ్ టీమ్ కు కేటాయించండి మరియు ప్రగతి నివేదికను రూపొందించండి".
### ఉదాహరణ 2: AI పరిశోధన సహాయకుడు
సన్నివేశం: అకాడమిక్ పరిశోధన సహాయ సాధనం, పరిశోధకులకు సమాచారాన్ని సేకరించడానికి, పత్రం నిర్మాణాన్ని క్రమబద్ధీకరించడానికి, సహకార రచనకు సహాయం చేయడం.
అమలు చేయాల్సిన ముఖ్యాంశాలు:
- LangGraph ఏజెంట్ సమాచార శోధన మరియు తార్కిక నిర్ధారణకు బాధ్యత వహిస్తుంది
- CopilotKit ఫ్రంట్ ఎండ్ పరిశోధన రూపరేఖ, సాహిత్య జాబితాను ప్రదర్శిస్తుంది
- స్థితి సమకాలీకరణ పరిశోధన పురోగతిని నిజ సమయంగా సేవ్ చేయడం మరియు ప్రదర్శించడం నిర్ధారిస్తుంది
- బాహ్య సమాచారాన్ని ఉల్లేఖించేటప్పుడు వినియోగదారుడిని నిర్ధారించడానికి ఆమోద నోడ్లు సూచిస్తాయి
### ఉదాహరణ 3: తెలివైన ఫారమ్ నింపడం
సన్నివేశం: సంక్లిష్టమైన బీమా దరఖాస్తు ఫారమ్ను సంభాషణాత్మక పరస్పర చర్యగా మార్చడం.
అమలు చేయాల్సిన ముఖ్యాంశాలు:
- వినియోగదారుడి సమాధానాల ఆధారంగా ఏజెంట్ డైనమిక్గా తదుపరి ప్రశ్నను నిర్ణయిస్తుంది
- సందర్భాన్ని ఆధారంగా వివిధ UI భాగాలను చూపించడానికి షరతుల రాండరింగ్ను ఉపయోగిస్తుంది
- భాగంగా పూర్తి చేసిన ఫారమ్ను ఆటోమేటిక్గా సేవ్ చేస్తుంది, బ్రేక్ పాయింట్ కొనసాగింపును మద్దతు ఇస్తుంది
- సమర్పణకు ముందు వినియోగదారుడి నిర్ధారణ కోసం అన్ని సమాచారాన్ని సమీకరిస్తుంది
## సాంకేతిక సూచనలు
CopilotKit యొక్క సాంకేతిక అమలు ఆధునిక వెబ్ స్టాక్పై ఆధారపడి ఉంది. ఫ్రంట్ ఎండ్ ప్రధాన UI ఫ్రేమ్వర్క్గా React (Angular ను కూడా మద్దతు ఇస్తుంది) ను ఉపయోగిస్తుంది, స్థితి నిర్వహణ మరియు ఏజెంట్ పరస్పర చర్య కోసం useAgent మరియు useCoAgent వంటి హుక్లను అందిస్తుంది. బ్యాక్ ఎండ్ రన్టైమ్ CopilotRuntime తరగతిగా కేంద్ర సమన్వయకర్తగా పనిచేస్తుంది, అభ్యర్థన ధృవీకరణ, LLM కాల్ మరియు స్పందన ప్రవాహాన్ని నిర్వహిస్తుంది. కమ్యూనికేషన్ ప్రోటోకాల్ సర్వర్-సెంట్ ఈవెంట్స్ (SSE) ను ఉపయోగించి సర్వర్ నుండి క్లయింట్కు నిజ సమయ ప్రవాహాన్ని పంపిస్తుంది, అదే సమయంలో HTTP POST ద్వారా క్లయింట్ అభ్యర్థనలను నిర్వహిస్తుంది.
v1.50 వెర్షన్ ప్రధాన నిర్మాణ నవీకరణను తీసుకువచ్చింది, స్పష్టమైన ఏకీకృత ఎండ్ పాయింట్ నిర్మాణం, మెరుగైన గమనీయత (టెలిమెట్రీ బిల్ట్-ఇన్) మరియు CopilotKit Next తో లోతైన సమీకరణను ప్రవేశపెట్టింది, అభివృద్ధి అనుభవాన్ని మరింత సరళతరం చేసింది.
## భవిష్యత్తు దృక్పథంCopilotKit యొక్క వ్యూహాత్మక స్థానం అనేది ప్రతినిధి అప్లికేషన్ అభివృద్ధి యొక్క మౌలిక వసతిగా మారడం. AG-UI ప్రోటోకాల్ మరింత మంది తయారీదారులచే (Microsoft, Google, AWS మొదలైనవి అన్ని మద్దతు ఇచ్చాయి) స్వీకరించబడుతున్నందున, ఓపెన్ స్టాండర్డ్స్ ఆధారిత ప్రతినిధి అప్లికేషన్ పర్యావరణం ఏర్పడుతోంది. CopilotKit ముందుగా నిర్మించిన భాగాలు, జనరేటివ్ UI నమూనాలు మరియు లోతైన ఫ్రేమ్వర్క్ ఇంటిగ్రేషన్ను అందించడం ద్వారా, ఉత్పత్తి స్థాయి AI Copilot ను నిర్మించడానికి అవసరమైన అడ్డంకులను గణనీయంగా తగ్గిస్తుంది, అభివృద్ధి దారులకు తక్కువ స్థాయి కమ్యూనికేషన్ వివరాల బదులు వ్యాపార తర్కంపై దృష్టి పెట్టడానికి అవకాశం ఇస్తుంది.

