FastAPIని ఉపయోగించి అధిక పనితీరు, ఉత్పత్తికి సిద్ధంగా ఉన్న LLM APIని నిర్మించడం: ఒక అడుగుల వారీ మార్గదర్శకం

2/19/2026
5 min read
# FastAPIని ఉపయోగించి అధిక పనితీరు, ఉత్పత్తికి సిద్ధంగా ఉన్న LLM APIని నిర్మించడం: ఒక అడుగుల వారీ మార్గదర్శకం

FastAPI, ఒక ఆధునిక, అధిక పనితీరు గల Python వెబ్ ఫ్రేమ్‌వర్క్, దాని సులభ వినియోగం, వేగం మరియు స్వయంచాలకంగా ఉత్పత్తి చేయబడిన API డాక్యుమెంటేషన్ కారణంగా బాగా ప్రాచుర్యం పొందింది. ముఖ్యంగా LLM (Large Language Model) అప్లికేషన్‌ల బ్యాకెండ్ APIని నిర్మించడంలో, FastAPI బలమైన ప్రయోజనాలను ప్రదర్శిస్తుంది. ఈ కథనం FastAPIని ఉపయోగించి ఉత్పత్తికి సిద్ధంగా ఉన్న LLM APIని ఎలా నిర్మించాలో మరియు కొన్ని ఉత్తమ పద్ధతులను అన్వేషిస్తుందో అడుగుల వారీగా మీకు నేర్పుతుంది.

## FastAPIని ఎందుకు ఎంచుకోవాలి?

LLM అప్లికేషన్ యొక్క APIని నిర్మించేటప్పుడు, FastAPI ఈ క్రింది కీలక ప్రయోజనాలను అందిస్తుంది:

* **అధిక పనితీరు:** ASGI ఆధారంగా, FastAPI అధిక ఏకకాల అభ్యర్థనలను నిర్వహించగలదు, ఇది శీఘ్ర ప్రతిస్పందన అవసరమయ్యే LLM అప్లికేషన్‌లకు చాలా అవసరం.
* **సమకాలిక మద్దతు:** FastAPI `async` మరియు `await` కీలక పదాలకు అంతర్నిర్మిత మద్దతును కలిగి ఉంది, ఇది LLM అనుమితిని పిలవడం వంటి సమకాలిక కార్యకలాపాలను సులభంగా నిర్వహించగలదు మరియు ప్రధాన థ్రెడ్‌ను నిరోధించకుండా చేస్తుంది.
* **స్వయంచాలక API డాక్యుమెంటేషన్:** FastAPI OpenAPI మరియు JSON స్కీమాను ఉపయోగించి ఇంటరాక్టివ్ API డాక్యుమెంటేషన్‌ను (Swagger UI) స్వయంచాలకంగా ఉత్పత్తి చేస్తుంది, ఇది డెవలపర్‌లకు మీ APIని పరీక్షించడానికి మరియు ఉపయోగించడానికి సౌకర్యంగా ఉంటుంది.
* **డేటా ధ్రువీకరణ:** FastAPI Pydanticని ఉపయోగించి డేటా ధ్రువీకరణను నిర్వహిస్తుంది, అభ్యర్థన పారామితుల ఖచ్చితత్వాన్ని నిర్ధారిస్తుంది మరియు లోపాలను తగ్గిస్తుంది.
* **డిపెండెన్సీ ఇంజెక్షన్:** FastAPI యొక్క డిపెండెన్సీ ఇంజెక్షన్ సిస్టమ్ LLM మోడల్ వంటి వనరులను నిర్వహించడానికి మరియు భాగస్వామ్యం చేయడానికి సౌకర్యంగా ఉంటుంది.
* **చురుకైన సంఘం:** FastAPI విస్తారమైన మరియు చురుకైన సంఘాన్ని కలిగి ఉంది, ఇది సమృద్ధిగా వనరులు మరియు మద్దతును పొందగలదు.

## సన్నాహాలు

1. **Pythonని ఇన్స్టాల్ చేయండి:** మీరు Python 3.7 లేదా అంతకంటే ఎక్కువ వెర్షన్‌ను ఇన్‌స్టాల్ చేశారని నిర్ధారించుకోండి.
2. **FastAPI మరియు Uvicornని ఇన్స్టాల్ చేయండి:** pipని ఉపయోగించి FastAPI మరియు Uvicorn (ASGI సర్వర్)ని ఇన్స్టాల్ చేయండి:

   ```bash
   pip install fastapi uvicorn
  1. LLM మోడల్‌ను ఎంచుకోండి: మీరు ఉపయోగించాలనుకుంటున్న LLM మోడల్‌ను ఎంచుకోండి. ఇది OpenAI మోడల్ కావచ్చు లేదా TinyLlama వంటి ఓపెన్ సోర్స్ మోడల్ కావచ్చు. మీరు OpenAIని ఎంచుకుంటే, మీకు OpenAI API కీ అవసరం. మీరు TinyLlamaని ఎంచుకుంటే, మీరు మోడల్ ఫైల్‌ను డౌన్‌లోడ్ చేసుకోవాలి.

దశ 1: FastAPI అప్లికేషన్‌ను సృష్టించండి

main.py పేరుతో ఒక ఫైల్‌ను సృష్టించండి మరియు ఈ క్రింది కోడ్‌ను జోడించండి:

from fastapi import FastAPI, HTTPException
from pydantic import BaseModel

app = FastAPI(title="LLM API", description="LLMలతో పరస్పర చర్య చేయడానికి ఒక సాధారణ API.")

class InputText(BaseModel):
    text: str

class OutputText(BaseModel):
    generated_text: str

ఈ కోడ్ ఒక FastAPI అప్లికేషన్‌ను నిర్వచిస్తుంది మరియు రెండు Pydantic మోడల్‌లను నిర్వచిస్తుంది: InputText ఇన్‌పుట్ టెక్స్ట్‌ను స్వీకరించడానికి, OutputText ఉత్పత్తి చేయబడిన టెక్స్ట్‌ను తిరిగి ఇవ్వడానికి.

దశ 2: LLM అనుమితి తర్కాన్ని జోడించండి

మీరు ఎంచుకున్న LLM మోడల్ ప్రకారం, సంబంధిత అనుమితి తర్కాన్ని జోడించండి. ఇక్కడ OpenAI APIని ఉపయోగించడం ఒక ఉదాహరణ:

import openai
import os

# OpenAI API కీని పొందండి
openai.api_key = os.environ.get("OPENAI_API_KEY")  # పర్యావరణ వేరియబుల్‌ను ఉపయోగించమని సిఫార్సు చేయబడింది
```@app.post("/generate", response_model=OutputText)
async def generate_text(input_text: InputText):
    """
    Generates text based on the input text using OpenAI.
    """
    try:
        response = openai.Completion.create(
            engine="text-davinci-003", # మోడల్‌ను ఎంచుకోండి
            prompt=input_text.text,
            max_tokens=150,
            n=1,
            stop=None,
            temperature=0.7,
        )
        generated_text = response.choices[0].text.strip()
        return OutputText(generated_text=generated_text)
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

ఈ కోడ్ /generate రూట్‌ను నిర్వచిస్తుంది, ఇది ఇన్‌పుట్‌గా InputText ఆబ్జెక్ట్‌ను స్వీకరిస్తుంది, OpenAI APIని ఉపయోగించి వచనాన్ని ఉత్పత్తి చేస్తుంది మరియు ఉత్పత్తి చేయబడిన వచనాన్ని OutputText ఆబ్జెక్ట్‌గా తిరిగి ఇస్తుంది. text-davinci-003ని మీరు ఎంచుకున్న తగిన మోడల్‌తో భర్తీ చేయాలని గుర్తుంచుకోండి.

మీరు TinyLlama వంటి స్థానిక మోడల్‌లను ఉపయోగిస్తుంటే, మీరు transformers వంటి సంబంధిత లైబ్రరీని ఇన్‌స్టాల్ చేయాలి మరియు మోడల్‌ను మెమరీలోకి లోడ్ చేయాలి. కోడ్ ఉదాహరణ క్రింద ఇవ్వబడింది:

from transformers import pipeline
import torch

generator = pipeline('text-generation', model="TinyLlama/TinyLlama-1.1B-Chat-v1.0", torch_dtype=torch.bfloat16, device_map="auto")

@app.post("/generate", response_model=OutputText)
async def generate_text(input_text: InputText):
    """
    Generates text based on the input text using TinyLlama.
    """
    try:
        generated_text = generator(input_text.text, max_length=50, do_sample=True, temperature=0.7)[0]['generated_text']
        return OutputText(generated_text=generated_text)
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

దశ 3: FastAPI అప్లికేషన్‌ను అమలు చేయండి

Uvicornని ఉపయోగించి FastAPI అప్లికేషన్‌ను అమలు చేయండి:

uvicorn main:app --reload
```ఇది ఒక లోకల్ సర్వర్‌ను ప్రారంభిస్తుంది, మీరు మీ బ్రౌజర్‌లో `http://127.0.0.1:8000/docs` వద్ద స్వయంచాలకంగా ఉత్పత్తి చేయబడిన API డాక్యుమెంటేషన్‌ను చూడవచ్చు. `--reload` పారామీటర్ కోడ్‌లో మార్పులు చేసిన తర్వాత సర్వర్‌ను స్వయంచాలకంగా పునఃప్రారంభిస్తుంది, ఇది అభివృద్ధికి సౌకర్యంగా ఉంటుంది.

## దశ 4: APIని పరీక్షించండి

API డాక్యుమెంటేషన్ లేదా curl వంటి సాధనాలను ఉపయోగించి మీ APIని పరీక్షించండి. ఉదాహరణకు, curl ఉపయోగించి POST అభ్యర్థనను పంపండి:

```bash
curl -X POST -H "Content-Type: application/json" -d '{"text": "Tell me a joke about cats."}' http://127.0.0.1:8000/generate

మీరు ఉత్పత్తి చేయబడిన టెక్స్ట్‌తో JSON ప్రతిస్పందనను స్వీకరించాలి.

దశ 5: ఉత్పత్తి విస్తరణ

FastAPI అనువర్తనాన్ని ఉత్పత్తి వాతావరణంలో విస్తరించండి, ఉదాహరణకు:

  • Docker: మీ అనువర్తనాన్ని కంటైనరైజ్ చేయడానికి Dockerని ఉపయోగించండి, ఇది విస్తరణ మరియు నిర్వహణను సులభతరం చేస్తుంది.
  • క్లౌడ్ ప్లాట్‌ఫారమ్: AWS, Google Cloud Platform లేదా Azure వంటి క్లౌడ్ ప్లాట్‌ఫారమ్‌కు విస్తరించండి. టెక్స్ట్‌లో పేర్కొన్న Azure Cosmos DB మరియు Azure Functions సర్వర్‌లెస్ APIని రూపొందించడానికి ఉపయోగించవచ్చు. స్వయంచాలకంగా విస్తరించే FastAPI అనువర్తనాలను విస్తరించడానికి Modal కూడా ఉపయోగించవచ్చు.
  • సర్వర్: మీ స్వంత సర్వర్‌కు విస్తరించండి.

ఉత్తమ పద్ధతులు

  • సున్నితమైన సమాచారాన్ని నిల్వ చేయడానికి పర్యావరణ వేరియబుల్స్‌ను ఉపయోగించండి: API కీలు వంటి సున్నితమైన సమాచారాన్ని కోడ్‌లో హార్డ్ కోడ్ చేయవద్దు, బదులుగా పర్యావరణ వేరియబుల్స్‌ను ఉపయోగించండి.
  • లాగ్ రికార్డింగ్‌ను జోడించండి: API యొక్క ఆపరేటింగ్ స్థితిని రికార్డ్ చేయడానికి లాగ్ రికార్డింగ్ మాడ్యూల్‌ను ఉపయోగించండి, ఇది డీబగ్గింగ్ మరియు పర్యవేక్షణకు సౌకర్యంగా ఉంటుంది.
  • లోపం నిర్వహణను జోడించండి: సంభవించే మినహాయింపులను నిర్వహించడానికి try...except బ్లాక్‌ను ఉపయోగించండి మరియు తగిన లోపం సమాచారాన్ని తిరిగి ఇవ్వండి.
  • రేటు పరిమితి: API దుర్వినియోగం కాకుండా నిరోధించడానికి రేటు పరిమితిని ఉపయోగించండి. FastAPIలో కొన్ని సిద్ధంగా ఉన్న రేటు పరిమితి లైబ్రరీలు అందుబాటులో ఉన్నాయి.
  • కాష్: పునరావృత అభ్యర్థనల కోసం, పనితీరును మెరుగుపరచడానికి కాష్‌ను ఉపయోగించవచ్చు.
  • పర్యవేక్షణ: API యొక్క పనితీరు మరియు లభ్యతను పర్యవేక్షించడానికి పర్యవేక్షణ సాధనాలను ఉపయోగించండి.

అధునాతన ఉపాయాలు

  • సమకాలికం కాని ప్రాసెసింగ్: సమయం తీసుకునే LLM అనుమితి కోసం, ప్రధాన థ్రెడ్‌ను నిరోధించకుండా ఉండటానికి async మరియు await కీవర్డ్‌లను ఉపయోగించి సమకాలికం కాని ప్రాసెసింగ్‌ను నిర్వహించండి.
  • స్ట్రీమింగ్ ప్రతిస్పందన: స్ట్రీమింగ్ ప్రతిస్పందనను (StreamingResponse) ఉపయోగించడం ద్వారా నిజ సమయంలో ఉత్పత్తి చేయబడిన టెక్స్ట్‌ను తిరిగి ఇవ్వవచ్చు, ఇది వినియోగదారు అనుభవాన్ని మెరుగుపరుస్తుంది.
  • మల్టీథ్రెడింగ్/మల్టీప్రాసెసింగ్: CPU ఇంటెన్సివ్ LLM అనుమితి కోసం, పనితీరును మెరుగుపరచడానికి మల్టీథ్రెడింగ్ లేదా మల్టీప్రాసెసింగ్‌ను ఉపయోగించవచ్చు.
  • GPU త్వరణం: మీ LLM మోడల్ GPU త్వరణానికి మద్దతు ఇస్తే, అనుమితి వేగాన్ని మెరుగుపరచడానికి CUDA లేదా ఇతర GPU త్వరణ లైబ్రరీలను ఉపయోగించవచ్చు.

ముగింపుFastAPI అనేది అధిక పనితీరు, ఉత్పత్తికి సిద్ధంగా ఉన్న LLM API లను నిర్మించడానికి ఒక శక్తివంతమైన సాధనం. ఈ కథనంలోని మార్గదర్శి ద్వారా, మీరు త్వరగా LLM APIని ఏర్పాటు చేసుకోవచ్చు మరియు మీ అవసరాలకు అనుగుణంగా విస్తరించుకోవచ్చు మరియు ఆప్టిమైజ్ చేసుకోవచ్చు. నిరంతర అభ్యాసం మరియు సాధన ఒక గొప్ప LLM అప్లికేషన్ డెవలపర్ కావడానికి కీలకం అని గుర్తుంచుకోండి. Hornbeam కూడా ఒక ముఖ్యమైన ASGI సర్వర్, ఇది Gunicorn కంటే వేగంగా మరియు స్థిరంగా ఉంటుందని పేర్కొంది, దీనిని FastAPI అప్లికేషన్‌లను అమలు చేయడానికి ఉపయోగించవచ్చు.

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy మార్పు మార్గదర్శకం: ఎలా పొందాలి మెరుపు పురాణ స్థాయి పెంపుడు

Claude Code Buddy మార్పు మార్గదర్శకం: ఎలా పొందాలి మెరుపు పురాణ స్థాయి పెంపుడు 2026年4月1日,Anthropic 在 Claude Code 2.1.89 版...

Obsidian Defuddle విడుదల చేసింది, Obsidian Web Clipper ను కొత్త ఎత్తుకు తీసుకువెళ్ళిందిTechnology

Obsidian Defuddle విడుదల చేసింది, Obsidian Web Clipper ను కొత్త ఎత్తుకు తీసుకువెళ్ళింది

Obsidian Defuddle విడుదల చేసింది, Obsidian Web Clipper ను కొత్త ఎత్తుకు తీసుకువెళ్ళింది నేను ఎప్పుడూ Obsidian యొక్క కేం...

OpenAI తక్షణమే "మూడింటి" ప్రకటించింది: బ్రౌజర్ + ప్రోగ్రామింగ్ + ChatGPT విలీనం, గత సంవత్సరం తప్పు మార్గంలో నడిచినట్లు అంతర్గతంగా అంగీకరించిందిTechnology

OpenAI తక్షణమే "మూడింటి" ప్రకటించింది: బ్రౌజర్ + ప్రోగ్రామింగ్ + ChatGPT విలీనం, గత సంవత్సరం తప్పు మార్గంలో నడిచినట్లు అంతర్గతంగా అంగీకరించింది

OpenAI తక్షణమే "మూడింటి" ప్రకటించింది: బ్రౌజర్ + ప్రోగ్రామింగ్ + ChatGPT విలీనం, గత సంవత్సరం తప్పు మార్గంలో నడిచినట్లు అ...

2026, ఇకపై మీరే 'ఆత్మ నియంత్రణ'ని బలవంతం చేయవద్దు! ఈ 8 చిన్న విషయాలను సరిగ్గా చేయండి, ఆరోగ్యం స్వయంగా వస్తుందిHealth

2026, ఇకపై మీరే 'ఆత్మ నియంత్రణ'ని బలవంతం చేయవద్దు! ఈ 8 చిన్న విషయాలను సరిగ్గా చేయండి, ఆరోగ్యం స్వయంగా వస్తుంది

2026, ఇకపై మీరే 'ఆత్మ నియంత్రణ'ని బలవంతం చేయవద్దు! ఈ 8 చిన్న విషయాలను సరిగ్గా చేయండి, ఆరోగ్యం స్వయంగా వస్తుంది కొత్త సం...

అవి కష్టపడుతున్న తల్లులు, బరువు తగ్గలేక పోతున్న వారు, ఇక్కడే తప్పు చేస్తున్నారుHealth

అవి కష్టపడుతున్న తల్లులు, బరువు తగ్గలేక పోతున్న వారు, ఇక్కడే తప్పు చేస్తున్నారు

అవి కష్టపడుతున్న తల్లులు, బరువు తగ్గలేక పోతున్న వారు, ఇక్కడే తప్పు చేస్తున్నారు మార్చి నెల మూడవ భాగం దాటింది, మీ బరువు ...

📝
Technology

AI Browser 24小时稳定运行指南

AI Browser 24小时稳定运行指南 ఈ పాఠం స్థిరంగా, దీర్ఘకాలికంగా పనిచేసే AI బ్రౌజర్ వాతావరణాన్ని ఎలా ఏర్పాటు చేయాలో వివరిస్తుంది. 适用...