AllYourBot · lumpidu · Jul 14, 2024 · Jul 15, 2024 · krschacht · Jul 15, 2024
diff --git a/app/controllers/messages_controller.rb b/app/controllers/messages_controller.rb
@@ -101,6 +101,8 @@ def message_params
       :cancelled_at,
       :branched,
       :branched_from_version,
+      :input_token_count,
+      :output_token_count,
       documents_attributes: [:file]
     )
     if modified_params.has_key?(:content_text) && modified_params[:content_text].blank?

diff --git a/app/models/message.rb b/app/models/message.rb
@@ -1,5 +1,5 @@
 class Message < ApplicationRecord
-  include DocumentImage, Version, Cancellable, Toolable
+  include DocumentImage, Version, Cancellable, Toolable, TokenCount
 
   belongs_to :assistant
   belongs_to :conversation

diff --git a/app/models/message/token_count.rb b/app/models/message/token_count.rb
@@ -0,0 +1,7 @@
+module Message::TokenCount
+  extend ActiveSupport::Concern
+  included do
+    attribute :input_token_count, :integer, default: 0
+    attribute :output_token_count, :integer, default: 0
+  end
+end
diff --git a/app/services/ai_backend/anthropic.rb b/app/services/ai_backend/anthropic.rb
@@ -28,6 +28,15 @@ def get_next_chat_message(&chunk_received_handler)
 
     response_handler = proc do |intermediate_response, bytesize|
       chunk = intermediate_response.dig("delta", "text")
+
+      # input and output tokens are sent in different responses
+      if (input_tokens = intermediate_response.dig("message", "usage", "input_tokens"))
+        @message.input_token_count += input_tokens
+      end
+      if (output_tokens = intermediate_response.dig("message", "usage", "output_tokens"))
+        @message.output_token_count += output_tokens
+      end
+
       print chunk if Rails.env.development?
       if chunk
         stream_response_text += chunk

diff --git a/app/services/ai_backend/open_ai.rb b/app/services/ai_backend/open_ai.rb
@@ -35,6 +35,7 @@ def get_next_chat_message(&chunk_handler)
         tools: Toolbox.tools,
         stream: response_handler,
         max_tokens: 2000, # we should really set this dynamically, based on the model, to the max
+        stream_options: {include_usage: true}
       })
     rescue ::Faraday::UnauthorizedError => e
       raise ::OpenAI::ConfigurationError
@@ -54,6 +55,12 @@ def stream_handler(&chunk_received_handler)
       content_chunk = intermediate_response.dig("choices", 0, "delta", "content")
       tool_calls_chunk = intermediate_response.dig("choices", 0, "delta", "tool_calls")
 
+      # input and output tokens are sent in the same response
+      if (input_tokens, output_tokens = intermediate_response["usage"]&.values_at("prompt_tokens", "completion_tokens"))
+        @message.input_token_count += input_tokens
+        @message.output_token_count += output_tokens
+      end
+
       print content_chunk if Rails.env.development?
       if content_chunk
         @stream_response_text += content_chunk

diff --git a/app/views/messages/_message.html.erb b/app/views/messages/_message.html.erb
@@ -245,6 +245,24 @@ end
                 <% end %>
               </menu>
             </div>
+            <% if last_message %>
+              <% input_tokens = conversation.messages.sum(:input_token_count) %>
+              <% output_tokens = conversation.messages.sum(:output_token_count) %>
+
+              <div class="dropdown dropdown-top flex items-center ml-2">
+                <%= button_tag "$",
+                               tabindex: 0,
+                               role: :button,
+                               class: "text-gray-600 dark:text-gray-300 hover:text-gray-900 dark:hover:text-white",
+                               data: { role: "show-token-info" }
+                %>
+
+                <div tabindex="0" class="dropdown-content -ml-6 z-10 p-2 shadow-xl bg-base-100 rounded-box w-52 dark:!bg-gray-700">
+                  <p class="py-1 px-2 text-sm text-gray-700 dark:text-gray-300">Input tokens: <%= input_tokens %></p>
+                  <p class="py-1 px-2 text-sm text-gray-700 dark:text-gray-300">Output tokens: <%= output_tokens %></p>
+                </div>
+              </div>
+            <% end %>
           <% end %>
         </div>
       </turbo-frame>

diff --git a/db/migrate/20240713130357_add_token_counts_to_messages.rb b/db/migrate/20240713130357_add_token_counts_to_messages.rb
@@ -0,0 +1,6 @@
+class AddTokenCountsToMessages < ActiveRecord::Migration[7.1]
+  def change
+    add_column :messages, :input_token_count, :integer, default: 0, null: false
+    add_column :messages, :output_token_count, :integer, default: 0, null: false
+  end
+end
diff --git a/db/schema.rb b/db/schema.rb
@@ -10,7 +10,7 @@
 #
 # It's strongly recommended that you check this file into your version control system.
 
-ActiveRecord::Schema[7.1].define(version: 2024_06_24_100000) do
+ActiveRecord::Schema[7.1].define(version: 2024_07_13_130357) do
   # These are extensions that must be enabled in order to support this database
   enable_extension "plpgsql"
 
@@ -197,6 +197,8 @@
     t.integer "branched_from_version"
     t.jsonb "content_tool_calls"
     t.string "tool_call_id"
+    t.integer "input_token_count", default: 0, null: false
+    t.integer "output_token_count", default: 0, null: false
     t.index ["assistant_id"], name: "index_messages_on_assistant_id"
     t.index ["content_document_id"], name: "index_messages_on_content_document_id"
     t.index ["conversation_id", "index", "version"], name: "index_messages_on_conversation_id_and_index_and_version", unique: true