## बुनियादी पॉलिसी
एक पॉलिसी एक फ़ंक्शन है जो कॉन्टेक्स्ट लेता है और परिवर्तन लौटाता है:
## नीति संदर्भ
ctx dict में ये फ़ील्ड शामिल होते हैं:
| Field | Type | Description |
|---|---|---|
step | int | वर्तमान निष्पादन चरण (1-इंडेक्स्ड) |
messages | list | अब तक की बातचीत का इतिहास |
tools_called | list | पिछले चरणों में कॉल किए गए टूल्स |
## नीति रिटर्न
नीतियाँ निम्नलिखित लौटा सकती हैं:
| Field | Effect |
|---|---|
message_prepend / messagePrepend | अगली model कॉल से पहले जोड़े जाने वाले संदेश |
message_append / messageAppend | वार्तालाप के बाद जोड़े जाने वाले संदेश |
max_steps / maxSteps | अधिकतम स्टेप काउंट को ओवरराइड करता है |
stop | निष्पादन को समय से पहले रोकने के लिए बूलियन मान |
## उपयोग के मामले
रेट लिमिटिंग: कई चरणों में API (एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस) कॉल्स को ट्रैक करें, सीमा के पास पहुँचने पर उन्हें अस्थायी रूप से रोक दें।
गार्डरेल्स: आउटपुट में नीति उल्लंघनों की जाँच करें, सुधार के लिए correction prompts इंजेक्ट करें।
डायनेमिक निर्देश: मध्यवर्ती परिणामों के आधार पर व्यवहार बदलें।
लागत नियंत्रण: महँगे ऑपरेशन्स की एक निश्चित संख्या के बाद निष्पादन रोक दें।
## टूल इवेंट कॉलबैक्स
on_tool_event के साथ tool execution को मॉनिटर करें:
## अगले चरण
- टूल्स — ऐसे टूल्स परिभाषित करें जिन्हें नीतियाँ नियंत्रित कर सकती हैं