Update model to gpt-4o-mini

pierrelefevre · Sep 30, 2024 · a729811 · a729811
1 parent 8ce6735
commit a729811
Showing 1 changed file with 107 additions and 69 deletions.
diff --git a/aggregator/llm.py b/aggregator/llm.py
@@ -2,35 +2,38 @@
 from dotenv import load_dotenv
 import openai
 from openai import OpenAI
-import os 
+import os
 
-client = OpenAI(api_key=os.getenv("openai_secret"), organization=os.getenv("openai_org"))
+client = OpenAI(
+    api_key=os.getenv("openai_secret"), organization=os.getenv("openai_org")
+)
 import os
 import tiktoken
 import helpers
 
 load_dotenv()
 
-def num_tokens_from_messages(messages, model="gpt-3.5-turbo-0613"):
+model = "gpt-4o-mini"
+
+
+def num_tokens_from_messages(messages):
     """Returns the number of tokens used by a list of messages."""
     try:
         encoding = tiktoken.encoding_for_model(model)
     except KeyError:
         encoding = tiktoken.get_encoding("cl100k_base")
-    if model == "gpt-3.5-turbo-0613":  # note: future models may deviate from this
-        num_tokens = 0
-        for message in messages:
-            # every message follows <im_start>{role/name}\n{content}<im_end>\n
-            num_tokens += 4
-            for key, value in message.items():
-                num_tokens += len(encoding.encode(value))
-                if key == "name":  # if there's a name, the role is omitted
-                    num_tokens += -1  # role is always required and always 1 token
-        num_tokens += 2  # every reply is primed with <im_start>assistant
-        return num_tokens
-    else:
-        raise NotImplementedError(f"""num_tokens_from_messages() is not presently implemented for model {model}.
-  See https://github.com/openai/openai-python/blob/main/chatml.md for information on how messages are converted to tokens.""")
+
+    num_tokens = 0
+    for message in messages:
+        # every message follows <im_start>{role/name}\n{content}<im_end>\n
+        num_tokens += 4
+        for key, value in message.items():
+            num_tokens += len(encoding.encode(value))
+            if key == "name":  # if there's a name, the role is omitted
+                num_tokens += -1  # role is always required and always 1 token
+    num_tokens += 2  # every reply is primed with <im_start>assistant
+
+    return num_tokens
 
 
 def summarize(article):
@@ -44,20 +47,27 @@ def summarize(article):
 
 def _summarize(article):
 
-    body = "sammanfatta artikeln nedan till cirka 100-200 ord i 1-3 stycken. Texten ska vara lättläst, opartisk och professionell. Använd ny rad när lämpligt så texten blir luftig. Ignorera länkar till samt information om poddar, nyhetspodd, premium tidningar Du ska också lägga till ett fält med hur viktig den här artikeln är för läsaren att klicka på, en siffra från 1-5. Du ska svara i JSON format med fälten title och body: som följande: {\"title\": \"...\", \"body\": \"...\", \"importance\": ...}."
+    body = 'sammanfatta artikeln nedan till cirka 100-200 ord i 1-3 stycken. Texten ska vara lättläst, opartisk och professionell. Använd ny rad när lämpligt så texten blir luftig. Ignorera länkar till samt information om poddar, nyhetspodd, premium tidningar Du ska också lägga till ett fält med hur viktig den här artikeln är för läsaren att klicka på, en siffra från 1-5. Du ska svara i JSON format med fälten title och body: som följande: {"title": "...", "body": "...", "importance": ...}.'
     data = json.dumps(article)
 
-    while num_tokens_from_messages([
-        {"role": "system", "content": body},
-        {"role": "assistant", "content": data},
-    ]) > 4000:
+    while (
+        num_tokens_from_messages(
+            [
+                {"role": "system", "content": body},
+                {"role": "assistant", "content": data},
+            ]
+        )
+        > 4000
+    ):
         data = data[0:-100]
 
-    completion = client.chat.completions.create(model="gpt-3.5-turbo",
-    messages=[
-        {"role": "system", "content": body},
-        {"role": "assistant", "content": data},
-    ])
+    completion = client.chat.completions.create(
+        model=model,
+        messages=[
+            {"role": "system", "content": body},
+            {"role": "assistant", "content": data},
+        ],
+    )
     message = completion.choices[0].message.content
     summary = json.loads(message)
     return summary
@@ -87,28 +97,35 @@ def group_headlines(headlines):
                     break
 
             if valid:
-                helpers.log(f'Grouping took {i+1} tries')
+                helpers.log(f"Grouping took {i+1} tries")
                 return groups
         except:
             pass
 
 
 def _group_headlines(headlines):
-    body = "Gruppera de mest intressanta titlar i 3 grupper. Svara i JSON format med nyhetens namn som nyckel och en array av ID till artiklarna som ingår i den kategorin. Exempel: {\"Morden i Jordbro\": [...],  \"Kriget i Ukraina\": [...]}. JSON strängen måste vara komplett. Namnen till kategorierna ska vara max några ord men spännande och reflektera kopplingen mellan artiklarna. Varje artikel får vara med i mest en grupp, och grupperna får innehålla max 5 artiklar."
+    body = 'Gruppera de mest intressanta titlar i 3 grupper. Svara i JSON format med nyhetens namn som nyckel och en array av ID till artiklarna som ingår i den kategorin. Exempel: {"Morden i Jordbro": [...],  "Kriget i Ukraina": [...]}. JSON strängen måste vara komplett. Namnen till kategorierna ska vara max några ord men spännande och reflektera kopplingen mellan artiklarna. Varje artikel får vara med i mest en grupp, och grupperna får innehålla max 5 artiklar.'
 
     data = json.dumps(headlines).replace("}", "").replace("{", "")
 
-    while num_tokens_from_messages([
-        {"role": "system", "content": body},
-        {"role": "assistant", "content": data},
-    ]) > 4000:
+    while (
+        num_tokens_from_messages(
+            [
+                {"role": "system", "content": body},
+                {"role": "assistant", "content": data},
+            ]
+        )
+        > 4000
+    ):
         data = data[0:-100]
 
-    completion = client.chat.completions.create(model="gpt-3.5-turbo",
-    messages=[
-        {"role": "system", "content": body},
-        {"role": "assistant", "content": data},
-    ])
+    completion = client.chat.completions.create(
+        model=model,
+        messages=[
+            {"role": "system", "content": body},
+            {"role": "assistant", "content": data},
+        ],
+    )
     message = completion.choices[0].message.content
 
     groups = json.loads(message)
@@ -126,20 +143,27 @@ def pick_headline_topic(headline):
 
 def _pick_headline_topic(headline):
     topics = "Inrikes, Utrikes, Ekonomi, Politik, Opinion, Sport, Nöje & kultur, Tech"
-    body = f"Vilken kategori passar bäst för denna titel: {headline}? Svara med en av följande kategorier: {topics} i JSON format med fältet category: som följande: {{\"category\": \"...\"}}."
+    body = f'Vilken kategori passar bäst för denna titel: {headline}? Svara med en av följande kategorier: {topics} i JSON format med fältet category: som följande: {{"category": "..."}}.'
 
     data = json.dumps(headline)
-    while num_tokens_from_messages([
-        {"role": "system", "content": body},
-        {"role": "assistant", "content": data},
-    ]) > 4000:
+    while (
+        num_tokens_from_messages(
+            [
+                {"role": "system", "content": body},
+                {"role": "assistant", "content": data},
+            ]
+        )
+        > 4000
+    ):
         data = data[0:-100]
 
-    completion = client.chat.completions.create(model="gpt-3.5-turbo",
-    messages=[
-        {"role": "system", "content": body},
-        {"role": "assistant", "content": data},
-    ])
+    completion = client.chat.completions.create(
+        model=model,
+        messages=[
+            {"role": "system", "content": body},
+            {"role": "assistant", "content": data},
+        ],
+    )
     message = completion.choices[0].message.content
     category = json.loads(message)["category"]
     return category
@@ -150,8 +174,8 @@ def generate_digest(headlines):
     for i in range(3):
         try:
             digest = _generate_digest(headlines)
-            digest = digest.replace("}", "").replace("{", "").replace("\"", "")
-            helpers.log(f'Digest took {i+1} tries')
+            digest = digest.replace("}", "").replace("{", "").replace('"', "")
+            helpers.log(f"Digest took {i+1} tries")
             return digest
         except:
             pass
@@ -161,17 +185,24 @@ def _generate_digest(headlines):
     body = "Skriv en översiktlig nyhetssammanfattning i ett par meningar av det mest intressanta i följande nyheter. Använd inte punktlista. Du behöver inte ha med alla utan de nyheter som verkar mindre intressanta är bara att plocka bort.  "
     data = json.dumps(headlines)
 
-    while num_tokens_from_messages([
-        {"role": "system", "content": body},
-        {"role": "assistant", "content": data},
-    ]) > 4000:
+    while (
+        num_tokens_from_messages(
+            [
+                {"role": "system", "content": body},
+                {"role": "assistant", "content": data},
+            ]
+        )
+        > 4000
+    ):
         data = data[0:-100]
 
-    completion = client.chat.completions.create(model="gpt-3.5-turbo",
-    messages=[
-        {"role": "system", "content": body},
-        {"role": "assistant", "content": data},
-    ])
+    completion = client.chat.completions.create(
+        model=model,
+        messages=[
+            {"role": "system", "content": body},
+            {"role": "assistant", "content": data},
+        ],
+    )
     message = completion.choices[0].message.content
     return message
 
@@ -189,16 +220,23 @@ def _translate_to_english(text):
     body = "Translate the following text to English. The text is in Swedish and the translation should be in English."
     data = json.dumps(text)
 
-    while num_tokens_from_messages([
-        {"role": "system", "content": body},
-        {"role": "assistant", "content": data},
-    ]) > 4000:
+    while (
+        num_tokens_from_messages(
+            [
+                {"role": "system", "content": body},
+                {"role": "assistant", "content": data},
+            ]
+        )
+        > 4000
+    ):
         data = data[0:-100]
 
-    completion = client.chat.completions.create(model="gpt-3.5-turbo",
-    messages=[
-        {"role": "system", "content": body},
-        {"role": "assistant", "content": data},
-    ])
+    completion = client.chat.completions.create(
+        model=model,
+        messages=[
+            {"role": "system", "content": body},
+            {"role": "assistant", "content": data},
+        ],
+    )
     message = completion.choices[0].message.content
-    return message
+    return message