FastAPIని ఉపయోగించి అధిక పనితీరు, ఉత్పత్తికి సిద్ధంగా ఉన్న LLM APIని నిర్మించడం: ఒక అడుగుల వారీ మార్గదర్శకం

# FastAPIని ఉపయోగించి అధిక పనితీరు, ఉత్పత్తికి సిద్ధంగా ఉన్న LLM APIని నిర్మించడం: ఒక అడుగుల వారీ మార్గదర్శకం

FastAPI, ఒక ఆధునిక, అధిక పనితీరు గల Python వెబ్ ఫ్రేమ్‌వర్క్, దాని సులభ వినియోగం, వేగం మరియు స్వయంచాలకంగా ఉత్పత్తి చేయబడిన API డాక్యుమెంటేషన్ కారణంగా బాగా ప్రాచుర్యం పొందింది. ముఖ్యంగా LLM (Large Language Model) అప్లికేషన్‌ల బ్యాకెండ్ APIని నిర్మించడంలో, FastAPI బలమైన ప్రయోజనాలను ప్రదర్శిస్తుంది. ఈ కథనం FastAPIని ఉపయోగించి ఉత్పత్తికి సిద్ధంగా ఉన్న LLM APIని ఎలా నిర్మించాలో మరియు కొన్ని ఉత్తమ పద్ధతులను అన్వేషిస్తుందో అడుగుల వారీగా మీకు నేర్పుతుంది.

## FastAPIని ఎందుకు ఎంచుకోవాలి?

LLM అప్లికేషన్ యొక్క APIని నిర్మించేటప్పుడు, FastAPI ఈ క్రింది కీలక ప్రయోజనాలను అందిస్తుంది:

* **అధిక పనితీరు:** ASGI ఆధారంగా, FastAPI అధిక ఏకకాల అభ్యర్థనలను నిర్వహించగలదు, ఇది శీఘ్ర ప్రతిస్పందన అవసరమయ్యే LLM అప్లికేషన్‌లకు చాలా అవసరం.
* **సమకాలిక మద్దతు:** FastAPI `async` మరియు `await` కీలక పదాలకు అంతర్నిర్మిత మద్దతును కలిగి ఉంది, ఇది LLM అనుమితిని పిలవడం వంటి సమకాలిక కార్యకలాపాలను సులభంగా నిర్వహించగలదు మరియు ప్రధాన థ్రెడ్‌ను నిరోధించకుండా చేస్తుంది.
* **స్వయంచాలక API డాక్యుమెంటేషన్:** FastAPI OpenAPI మరియు JSON స్కీమాను ఉపయోగించి ఇంటరాక్టివ్ API డాక్యుమెంటేషన్‌ను (Swagger UI) స్వయంచాలకంగా ఉత్పత్తి చేస్తుంది, ఇది డెవలపర్‌లకు మీ APIని పరీక్షించడానికి మరియు ఉపయోగించడానికి సౌకర్యంగా ఉంటుంది.
* **డేటా ధ్రువీకరణ:** FastAPI Pydanticని ఉపయోగించి డేటా ధ్రువీకరణను నిర్వహిస్తుంది, అభ్యర్థన పారామితుల ఖచ్చితత్వాన్ని నిర్ధారిస్తుంది మరియు లోపాలను తగ్గిస్తుంది.
* **డిపెండెన్సీ ఇంజెక్షన్:** FastAPI యొక్క డిపెండెన్సీ ఇంజెక్షన్ సిస్టమ్ LLM మోడల్ వంటి వనరులను నిర్వహించడానికి మరియు భాగస్వామ్యం చేయడానికి సౌకర్యంగా ఉంటుంది.
* **చురుకైన సంఘం:** FastAPI విస్తారమైన మరియు చురుకైన సంఘాన్ని కలిగి ఉంది, ఇది సమృద్ధిగా వనరులు మరియు మద్దతును పొందగలదు.

## సన్నాహాలు

1. **Pythonని ఇన్స్టాల్ చేయండి:** మీరు Python 3.7 లేదా అంతకంటే ఎక్కువ వెర్షన్‌ను ఇన్‌స్టాల్ చేశారని నిర్ధారించుకోండి.
2. **FastAPI మరియు Uvicornని ఇన్స్టాల్ చేయండి:** pipని ఉపయోగించి FastAPI మరియు Uvicorn (ASGI సర్వర్)ని ఇన్స్టాల్ చేయండి:

   ```bash
   pip install fastapi uvicorn

LLM మోడల్‌ను ఎంచుకోండి: మీరు ఉపయోగించాలనుకుంటున్న LLM మోడల్‌ను ఎంచుకోండి. ఇది OpenAI మోడల్ కావచ్చు లేదా TinyLlama వంటి ఓపెన్ సోర్స్ మోడల్ కావచ్చు. మీరు OpenAIని ఎంచుకుంటే, మీకు OpenAI API కీ అవసరం. మీరు TinyLlamaని ఎంచుకుంటే, మీరు మోడల్ ఫైల్‌ను డౌన్‌లోడ్ చేసుకోవాలి.

దశ 1: FastAPI అప్లికేషన్‌ను సృష్టించండి

main.py పేరుతో ఒక ఫైల్‌ను సృష్టించండి మరియు ఈ క్రింది కోడ్‌ను జోడించండి:

from fastapi import FastAPI, HTTPException
from pydantic import BaseModel

app = FastAPI(title="LLM API", description="LLMలతో పరస్పర చర్య చేయడానికి ఒక సాధారణ API.")

class InputText(BaseModel):
    text: str

class OutputText(BaseModel):
    generated_text: str

ఈ కోడ్ ఒక FastAPI అప్లికేషన్‌ను నిర్వచిస్తుంది మరియు రెండు Pydantic మోడల్‌లను నిర్వచిస్తుంది: InputText ఇన్‌పుట్ టెక్స్ట్‌ను స్వీకరించడానికి, OutputText ఉత్పత్తి చేయబడిన టెక్స్ట్‌ను తిరిగి ఇవ్వడానికి.

దశ 2: LLM అనుమితి తర్కాన్ని జోడించండి

మీరు ఎంచుకున్న LLM మోడల్ ప్రకారం, సంబంధిత అనుమితి తర్కాన్ని జోడించండి. ఇక్కడ OpenAI APIని ఉపయోగించడం ఒక ఉదాహరణ:

import openai
import os

# OpenAI API కీని పొందండి
openai.api_key = os.environ.get("OPENAI_API_KEY")  # పర్యావరణ వేరియబుల్‌ను ఉపయోగించమని సిఫార్సు చేయబడింది
```@app.post("/generate", response_model=OutputText)
async def generate_text(input_text: InputText):
    """
    Generates text based on the input text using OpenAI.
    """
    try:
        response = openai.Completion.create(
            engine="text-davinci-003", # మోడల్‌ను ఎంచుకోండి
            prompt=input_text.text,
            max_tokens=150,
            n=1,
            stop=None,
            temperature=0.7,
        )
        generated_text = response.choices[0].text.strip()
        return OutputText(generated_text=generated_text)
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

ఈ కోడ్ /generate రూట్‌ను నిర్వచిస్తుంది, ఇది ఇన్‌పుట్‌గా InputText ఆబ్జెక్ట్‌ను స్వీకరిస్తుంది, OpenAI APIని ఉపయోగించి వచనాన్ని ఉత్పత్తి చేస్తుంది మరియు ఉత్పత్తి చేయబడిన వచనాన్ని OutputText ఆబ్జెక్ట్‌గా తిరిగి ఇస్తుంది. text-davinci-003ని మీరు ఎంచుకున్న తగిన మోడల్‌తో భర్తీ చేయాలని గుర్తుంచుకోండి.

మీరు TinyLlama వంటి స్థానిక మోడల్‌లను ఉపయోగిస్తుంటే, మీరు transformers వంటి సంబంధిత లైబ్రరీని ఇన్‌స్టాల్ చేయాలి మరియు మోడల్‌ను మెమరీలోకి లోడ్ చేయాలి. కోడ్ ఉదాహరణ క్రింద ఇవ్వబడింది:

from transformers import pipeline
import torch

generator = pipeline('text-generation', model="TinyLlama/TinyLlama-1.1B-Chat-v1.0", torch_dtype=torch.bfloat16, device_map="auto")

@app.post("/generate", response_model=OutputText)
async def generate_text(input_text: InputText):
    """
    Generates text based on the input text using TinyLlama.
    """
    try:
        generated_text = generator(input_text.text, max_length=50, do_sample=True, temperature=0.7)[0]['generated_text']
        return OutputText(generated_text=generated_text)
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

దశ 3: FastAPI అప్లికేషన్‌ను అమలు చేయండి

Uvicornని ఉపయోగించి FastAPI అప్లికేషన్‌ను అమలు చేయండి:

uvicorn main:app --reload
```ఇది ఒక లోకల్ సర్వర్‌ను ప్రారంభిస్తుంది, మీరు మీ బ్రౌజర్‌లో `http://127.0.0.1:8000/docs` వద్ద స్వయంచాలకంగా ఉత్పత్తి చేయబడిన API డాక్యుమెంటేషన్‌ను చూడవచ్చు. `--reload` పారామీటర్ కోడ్‌లో మార్పులు చేసిన తర్వాత సర్వర్‌ను స్వయంచాలకంగా పునఃప్రారంభిస్తుంది, ఇది అభివృద్ధికి సౌకర్యంగా ఉంటుంది.

## దశ 4: APIని పరీక్షించండి

API డాక్యుమెంటేషన్ లేదా curl వంటి సాధనాలను ఉపయోగించి మీ APIని పరీక్షించండి. ఉదాహరణకు, curl ఉపయోగించి POST అభ్యర్థనను పంపండి:

```bash
curl -X POST -H "Content-Type: application/json" -d '{"text": "Tell me a joke about cats."}' http://127.0.0.1:8000/generate

మీరు ఉత్పత్తి చేయబడిన టెక్స్ట్‌తో JSON ప్రతిస్పందనను స్వీకరించాలి.

దశ 5: ఉత్పత్తి విస్తరణ

FastAPI అనువర్తనాన్ని ఉత్పత్తి వాతావరణంలో విస్తరించండి, ఉదాహరణకు:

Docker: మీ అనువర్తనాన్ని కంటైనరైజ్ చేయడానికి Dockerని ఉపయోగించండి, ఇది విస్తరణ మరియు నిర్వహణను సులభతరం చేస్తుంది.
క్లౌడ్ ప్లాట్‌ఫారమ్: AWS, Google Cloud Platform లేదా Azure వంటి క్లౌడ్ ప్లాట్‌ఫారమ్‌కు విస్తరించండి. టెక్స్ట్‌లో పేర్కొన్న Azure Cosmos DB మరియు Azure Functions సర్వర్‌లెస్ APIని రూపొందించడానికి ఉపయోగించవచ్చు. స్వయంచాలకంగా విస్తరించే FastAPI అనువర్తనాలను విస్తరించడానికి Modal కూడా ఉపయోగించవచ్చు.
సర్వర్: మీ స్వంత సర్వర్‌కు విస్తరించండి.

ఉత్తమ పద్ధతులు

సున్నితమైన సమాచారాన్ని నిల్వ చేయడానికి పర్యావరణ వేరియబుల్స్‌ను ఉపయోగించండి: API కీలు వంటి సున్నితమైన సమాచారాన్ని కోడ్‌లో హార్డ్ కోడ్ చేయవద్దు, బదులుగా పర్యావరణ వేరియబుల్స్‌ను ఉపయోగించండి.
లాగ్ రికార్డింగ్‌ను జోడించండి: API యొక్క ఆపరేటింగ్ స్థితిని రికార్డ్ చేయడానికి లాగ్ రికార్డింగ్ మాడ్యూల్‌ను ఉపయోగించండి, ఇది డీబగ్గింగ్ మరియు పర్యవేక్షణకు సౌకర్యంగా ఉంటుంది.
లోపం నిర్వహణను జోడించండి: సంభవించే మినహాయింపులను నిర్వహించడానికి try...except బ్లాక్‌ను ఉపయోగించండి మరియు తగిన లోపం సమాచారాన్ని తిరిగి ఇవ్వండి.
రేటు పరిమితి: API దుర్వినియోగం కాకుండా నిరోధించడానికి రేటు పరిమితిని ఉపయోగించండి. FastAPIలో కొన్ని సిద్ధంగా ఉన్న రేటు పరిమితి లైబ్రరీలు అందుబాటులో ఉన్నాయి.
కాష్: పునరావృత అభ్యర్థనల కోసం, పనితీరును మెరుగుపరచడానికి కాష్‌ను ఉపయోగించవచ్చు.
పర్యవేక్షణ: API యొక్క పనితీరు మరియు లభ్యతను పర్యవేక్షించడానికి పర్యవేక్షణ సాధనాలను ఉపయోగించండి.

అధునాతన ఉపాయాలు

సమకాలికం కాని ప్రాసెసింగ్: సమయం తీసుకునే LLM అనుమితి కోసం, ప్రధాన థ్రెడ్‌ను నిరోధించకుండా ఉండటానికి async మరియు await కీవర్డ్‌లను ఉపయోగించి సమకాలికం కాని ప్రాసెసింగ్‌ను నిర్వహించండి.
స్ట్రీమింగ్ ప్రతిస్పందన: స్ట్రీమింగ్ ప్రతిస్పందనను (StreamingResponse) ఉపయోగించడం ద్వారా నిజ సమయంలో ఉత్పత్తి చేయబడిన టెక్స్ట్‌ను తిరిగి ఇవ్వవచ్చు, ఇది వినియోగదారు అనుభవాన్ని మెరుగుపరుస్తుంది.
మల్టీథ్రెడింగ్/మల్టీప్రాసెసింగ్: CPU ఇంటెన్సివ్ LLM అనుమితి కోసం, పనితీరును మెరుగుపరచడానికి మల్టీథ్రెడింగ్ లేదా మల్టీప్రాసెసింగ్‌ను ఉపయోగించవచ్చు.
GPU త్వరణం: మీ LLM మోడల్ GPU త్వరణానికి మద్దతు ఇస్తే, అనుమితి వేగాన్ని మెరుగుపరచడానికి CUDA లేదా ఇతర GPU త్వరణ లైబ్రరీలను ఉపయోగించవచ్చు.

ముగింపుFastAPI అనేది అధిక పనితీరు, ఉత్పత్తికి సిద్ధంగా ఉన్న LLM API లను నిర్మించడానికి ఒక శక్తివంతమైన సాధనం. ఈ కథనంలోని మార్గదర్శి ద్వారా, మీరు త్వరగా LLM APIని ఏర్పాటు చేసుకోవచ్చు మరియు మీ అవసరాలకు అనుగుణంగా విస్తరించుకోవచ్చు మరియు ఆప్టిమైజ్ చేసుకోవచ్చు. నిరంతర అభ్యాసం మరియు సాధన ఒక గొప్ప LLM అప్లికేషన్ డెవలపర్ కావడానికి కీలకం అని గుర్తుంచుకోండి. Hornbeam కూడా ఒక ముఖ్యమైన ASGI సర్వర్, ఇది Gunicorn కంటే వేగంగా మరియు స్థిరంగా ఉంటుందని పేర్కొంది, దీనిని FastAPI అప్లికేషన్‌లను అమలు చేయడానికి ఉపయోగించవచ్చు.

FastAPIని ఉపయోగించి అధిక పనితీరు, ఉత్పత్తికి సిద్ధంగా ఉన్న LLM APIని నిర్మించడం: ఒక అడుగుల వారీ మార్గదర్శకం

దశ 1: FastAPI అప్లికేషన్‌ను సృష్టించండి

దశ 2: LLM అనుమితి తర్కాన్ని జోడించండి

దశ 3: FastAPI అప్లికేషన్‌ను అమలు చేయండి

దశ 5: ఉత్పత్తి విస్తరణ

ఉత్తమ పద్ధతులు

అధునాతన ఉపాయాలు

You Might Also Like

Claude Code Buddy మార్పు మార్గదర్శకం: ఎలా పొందాలి మెరుపు పురాణ స్థాయి పెంపుడు

Obsidian Defuddle విడుదల చేసింది, Obsidian Web Clipper ను కొత్త ఎత్తుకు తీసుకువెళ్ళింది

2026, ఇకపై మీరే 'ఆత్మ నియంత్రణ'ని బలవంతం చేయవద్దు! ఈ 8 చిన్న విషయాలను సరిగ్గా చేయండి, ఆరోగ్యం స్వయంగా వస్తుంది

అవి కష్టపడుతున్న తల్లులు, బరువు తగ్గలేక పోతున్న వారు, ఇక్కడే తప్పు చేస్తున్నారు

AI Browser 24小时稳定运行指南