querytext.php — AI Engine – The Chatbot, AI Framework & MCP for WordPress 1.6.53

ai-engine / classes / querytext.php

ai-engine / classes Last commit date

modules 3 years ago admin.php 3 years ago ai.php 3 years ago answer.php 3 years ago api.php 3 years ago core.php 3 years ago init.php 3 years ago openai.php 3 years ago query.php 3 years ago queryembed.php 3 years ago queryimage.php 3 years ago querytext.php 3 years ago querytranscribe.php 3 years ago rest.php 3 years ago security.php 3 years ago

querytext.php

380 lines

1	<?php
2
3	class Meow_MWAI_QueryText extends Meow_MWAI_Query implements JsonSerializable {
4	public int $maxTokens = 1024;
5	public float $temperature = 0.8;
6	public int $maxSentences = 15;
7	public bool $isChat = false;
8	public ?string $stop = null;
9	public array $messages = [];
10	public ?string $context = null;
11	public ?string $newMessage = null;
12	public ?string $promptEnding = null;
13	public bool $casuallyFineTuned = false;
14
15	public function __construct( ?string $prompt = '', int $maxTokens = 1024, string $model = 'gpt-3.5-turbo' ) {
16	parent::__construct( $prompt );
17	$this->setModel( $model );
18	$this->setMaxTokens( $maxTokens );
19	}
20
21	public function jsonSerialize() {
22	return [
23	'class' => get_class( $this ),
24	'prompt' => $this->prompt,
25	'messages' => $this->messages,
26	'maxTokens' => $this->maxTokens,
27	'temperature' => $this->temperature,
28	'maxSentences' => $this->maxSentences,
29	'isChat' => $this->isChat,
30	'stop' => $this->stop,
31	'context' => $this->context,
32	'newMessage' => $this->newMessage,
33	'promptEnding' => $this->promptEnding,
34	'casuallyFineTuned' => $this->casuallyFineTuned,
35	'model' => $this->model,
36	'mode' => $this->mode,
37	'session' => $this->session,
38	'env' => $this->env,
39	'service' => $this->service,
40	];
41	}
42
43	public function getLastPrompt(): string {
44	if ( empty( $this->messages ) ) {
45	return $this->prompt;
46	}
47	$lastMessage = end( $this->messages );
48	return $lastMessage['content'];
49	}
50
51	// Quick and dirty token estimation
52	// Let's keep this synchronized with Helpers in JS
53	function estimateTokens( $content ): int
54	{
55	$text = "";
56	// https://github.com/openai/openai-cookbook/blob/main/examples/How_to_count_tokens_with_tiktoken.ipynb
57	if ( is_array( $content ) ) {
58	foreach ( $content as $message ) {
59	$role = $message['role'];
60	$content = $message['content'];
61	$text .= "=#=$role\n$content=#=\n";
62	}
63	}
64	else {
65	$text = $content;
66	}
67	$tokens = 0;
68	return apply_filters( 'mwai_estimate_tokens', (int)$tokens, $text, $this->model );
69	}
70
71	/**
72	* Make sure the maxTokens is not greater than the model's context length.
73	*/
74	public function finalChecks() {
75	if ( empty( $this->model ) ) { return; }
76
77	// Make sure the max tokens are respected.
78	$realMax = 4096;
79	$finetuneFamily = preg_match('/^([a-zA-Z]{0,32}):/', $this->model, $matches );
80	$finetuneFamily = ( isset( $matches ) && count( $matches ) > 0 ) ? $matches[1] : 'N/A';
81	$foundModel = null;
82	foreach ( MWAI_OPENAI_MODELS as $currentModel ) {
83	if ( $currentModel['model'] === $this->model \|\| $currentModel['family'] === $finetuneFamily ) {
84	$foundModel = $currentModel['name'];
85	$realMax = $currentModel['maxTokens'];
86	break;
87	}
88	}
89	$estimatedTokens = $this->estimateTokens( $this->messages );
90	if ( $estimatedTokens > $realMax ) {
91	throw new Exception( "AI Engine: The prompt is too long! It contains about $estimatedTokens tokens (estimation). The model $foundModel only accepts a maximum of $realMax tokens. " );
92	}
93	$realMax = (int)($realMax - $estimatedTokens) - 16;
94	if ( $this->maxTokens > $realMax ) {
95	$this->maxTokens = $realMax;
96	}
97
98	// Make sure the number of messages is not too great
99	if ( !empty( $this->maxSentences ) ) {
100	$context = array_shift( $this->messages );
101	if ( !empty( $this->messages ) ) {
102	$this->messages = array_slice( $this->messages, -$this->maxSentences * 2 );
103	}
104	else {
105	$this->messages = [];
106	}
107	if ( !empty( $context ) ) {
108	array_unshift( $this->messages, $context );
109	}
110	}
111	}
112
113	/**
114	* ID of the model to use.
115	* @param string $model ID of the model to use.
116	*/
117	public function setModel( string $model ) {
118	$this->model = $model;
119	$this->mode = 'completion';
120	foreach ( MWAI_OPENAI_MODELS as $currentModel ) {
121	if ( $currentModel['model'] === $this->model ) {
122	if ( $currentModel['mode'] ) {
123	$this->mode = $currentModel['mode'];
124	}
125	break;
126	}
127	}
128	}
129
130	/**
131	* Given a prompt, the model will return one or more predicted completions.
132	* It can also return the probabilities of alternative tokens at each position.
133	* @param string $prompt The prompt to generate completions.
134	*/
135	public function setPrompt( $prompt ) {
136	parent::setPrompt( $prompt );
137	$this->validateMessages();
138	}
139
140	/**
141	* The prompt is used by models who uses Text Completion (and not Chat Completion).
142	* This returns the prompt if it's not a chat, otherwise it will build a prompt with
143	* all the messages nicely formatted.
144	*/
145	public function getPrompt(): ?string {
146	if ( !$this->isChat ) {
147	return $this->prompt;
148	}
149
150	$first = reset( $this->messages );
151	$prompt = "";
152	if ( $first && $first['role'] === 'system' ) {
153	$prompt = $first['content'] . "\n\n";
154	}
155
156	// Casually Fine-Tuned or Prompt-Ending
157	if ( !empty( $this->promptEnding ) ) {
158	$last = end( $this->messages );
159	if ( $last && $last['role'] === 'user' ) {
160	$prompt = $last['content'] . $this->promptEnding;
161	}
162	return $prompt;
163	}
164
165	// Standard Completion
166	while ( $message = next( $this->messages ) ) {
167	$role = $message['role'];
168	$content = $message['content'];
169	if ( $role === 'system' ) {
170	$prompt .= "$content\n\n";
171	}
172	if ( $role === 'user' ) {
173	$prompt .= "User: $content\n";
174	}
175	if ( $role === 'assistant' ) {
176	$prompt .= "AI: $content\n";
177	}
178	}
179	$prompt .= "AI: ";
180	return $prompt;
181	}
182
183	/**
184	* Similar to the prompt, but focus on the new/last message.
185	* Only used when the model has a chat mode (and only used in messages).
186	* @param string $prompt The messages to generate completions.
187	*/
188	public function setNewMessage( string $newMessage ): void {
189	$this->newMessage = $newMessage;
190	$this->validateMessages();
191	}
192
193	public function replace( $search, $replace ) {
194	$this->prompt = str_replace( $search, $replace, $this->prompt );
195	$this->validateMessages();
196	}
197
198	public function setIsChat( $isChat ) {
199	$this->isChat = $isChat;
200	}
201
202	/**
203	* Similar to the prompt, but use an array of messages instead.
204	* @param string $prompt The messages to generate completions.
205	*/
206	public function setMessages( array $messages ) {
207	$messages = array_map( function( $message ) {
208	return [ 'role' => $message['role'], 'content' => $message['content'] ];
209	}, $messages );
210	$this->messages = $messages;
211	$this->validateMessages();
212	}
213
214	public function getLastMessage(): ?string {
215	if ( !empty( $this->messages ) ) {
216	$lastMessageIndex = count( $this->messages ) - 1;
217	$lastMessage = $this->messages[$lastMessageIndex];
218	return $lastMessage['content'];
219	}
220	return null;
221	}
222
223	// Function that adds a message just before the last message
224	public function injectContext( string $content ): void {
225	if ( !empty( $this->messages ) ) {
226	$lastMessageIndex = count( $this->messages ) - 1;
227	$lastMessage = $this->messages[$lastMessageIndex];
228	$this->messages[$lastMessageIndex] = [ 'role' => 'system', 'content' => $content ];
229	array_push( $this->messages, $lastMessage );
230	}
231	$this->validateMessages();
232	}
233
234	/**
235	* The context that is used for the chat completion (mode === 'chat').
236	* @param string $context The context to use.
237	*/
238	public function setContext( string $context ): void {
239	$this->context = apply_filters( 'mwai_ai_context', $context, $this );
240	$this->validateMessages();
241	}
242
243	private function validateMessages(): void {
244	// Messages should end with either the prompt or, if exists, the newMessage.
245	$message = empty( $this->newMessage ) ? $this->prompt : $this->newMessage;
246	if ( empty( $this->messages ) ) {
247	$this->messages = [ [ 'role' => 'user', 'content' => $message ] ];
248	}
249	else {
250	$last = &$this->messages[ count( $this->messages ) - 1 ];
251	if ( $last['role'] === 'user' ) {
252	$last['content'] = $message;
253	}
254	else {
255	array_push( $this->messages, [ 'role' => 'user', 'content' => $message ] );
256	}
257	}
258
259	// The main context must be first.
260	if ( !empty( $this->context ) ) {
261	if ( is_array( $this->messages ) && count( $this->messages ) > 0 ) {
262	if ( $this->messages[0]['role'] !== 'system' ) {
263	array_unshift( $this->messages, [ 'role' => 'system', 'content' => $this->context ] );
264	}
265	else {
266	$this->messages[0]['content'] = $this->context;
267	}
268	}
269	}
270	}
271
272	/**
273	* The maximum number of tokens to generate in the completion.
274	* The token count of your prompt plus max_tokens cannot exceed the model's context length.
275	* Most models have a context length of 2048 tokens (except for the newest models, which support 4096).
276	* @param float $prompt The maximum number of tokens.
277	*/
278	public function setMaxTokens( int $maxTokens ): void {
279	$this->maxTokens = $maxTokens;
280	}
281
282	/**
283	* Set the sampling temperature to use. Higher values means the model will take more risks.
284	* Try 0.9 for more creative applications, and 0 for ones with a well-defined answer.
285	* @param float $temperature The temperature.
286	*/
287	public function setTemperature( float $temperature ): void {
288	$temperature = floatval( $temperature );
289	if ( $temperature > 1 ) {
290	$temperature = 1;
291	}
292	if ( $temperature < 0 ) {
293	$temperature = 0;
294	}
295	$this->temperature = round( $temperature, 2 );
296	}
297
298	public function setMaxSentences( int $maxSentences ): void {
299	if ( !empty( $maxSentences ) ) {
300	$this->maxSentences = intval( $maxSentences );
301	$this->validateMessages();
302	}
303	}
304
305	public function setStop( string $stop ): void {
306	$this->stop = $stop;
307	}
308
309	// Based on the params of the query, update the attributes
310	public function injectParams( array $params ): void {
311	if ( isset( $params['model'] ) ) {
312	$this->setModel( $params['model'] );
313	}
314	if ( isset( $params['casually_fine_tuned'] ) && $params['casually_fine_tuned'] === true ) {
315	$this->promptEnding = "\\n\\n###\\n\\n";
316	$this->stop = "\\n\\n";
317	$this->casuallyFineTuned = true;
318	}
319	if ( isset( $params['casuallyFineTuned'] ) && $params['casuallyFineTuned'] === true ) {
320	$this->promptEnding = "\\n\\n###\\n\\n";
321	$this->stop = "\\n\\n";
322	$this->casuallyFineTuned = true;
323	}
324	if ( isset( $params['prompt'] ) ) {
325	$this->setPrompt( $params['prompt'] );
326	}
327	if ( isset( $params['context'] ) ) {
328	$this->setContext( $params['context'] );
329	}
330	if ( isset( $params['messages'] ) ) {
331	$this->setMessages( $params['messages'] );
332	}
333	if ( isset( $params['new_message'] ) ) {
334	$this->setNewMessage( $params['newMessage'] );
335	}
336	if ( isset( $params['newMessage'] ) ) {
337	$this->setNewMessage( $params['newMessage'] );
338	}
339	if ( isset( $params['max_tokens'] ) && intval( $params['max_tokens'] ) > 0 ) {
340	$this->setMaxTokens( intval( $params['max_tokens'] ) );
341	}
342	if ( isset( $params['maxTokens'] ) && intval( $params['maxTokens'] ) > 0 ) {
343	$this->setMaxTokens( intval( $params['maxTokens'] ) );
344	}
345	if ( isset( $params['max_sentences'] ) && intval( $params['max_sentences'] ) > 0 ) {
346	$this->setMaxSentences( intval( $params['max_sentences'] ) );
347	}
348	if ( isset( $params['maxSentences'] ) && intval( $params['maxSentences'] ) > 0 ) {
349	$this->setMaxSentences( intval( $params['maxSentences'] ) );
350	}
351	if ( isset( $params['temperature'] ) ) {
352	$this->setTemperature( $params['temperature'] );
353	}
354	if ( isset( $params['stop'] ) ) {
355	$this->setStop( $params['stop'] );
356	}
357	if ( isset( $params['max_results'] ) ) {
358	$this->setMaxResults( $params['max_results'] );
359	}
360	if ( isset( $params['maxResults'] ) ) {
361	$this->setMaxResults( $params['maxResults'] );
362	}
363	if ( isset( $params['env'] ) ) {
364	$this->setEnv( $params['env'] );
365	}
366	if ( isset( $params['session'] ) ) {
367	$this->setSession( $params['session'] );
368	}
369	// Should add the params related to Open AI and Azure
370	if ( isset( $params['service'] ) ) {
371	$this->setService( $params['service'] );
372	}
373	if ( isset( $params['api_key'] ) ) {
374	$this->setApiKey( $params['apiKey'] );
375	}
376	if ( isset( $params['apiKey'] ) ) {
377	$this->setApiKey( $params['apiKey'] );
378	}
379	}
380	}