smgc commited on
Commit
6232328
1 Parent(s): fd1af17

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +8 -15
app.py CHANGED
@@ -27,7 +27,6 @@ if proxy_url:
27
  transport = requests.Session()
28
  transport.proxies.update(proxies)
29
  else:
30
- proxies = None
31
  transport = None
32
 
33
  sio = socketio.Client(http_session=transport, logger=True, engineio_logger=True)
@@ -78,23 +77,17 @@ def normalize_content(content):
78
 
79
  def calculate_tokens_via_tiktoken(text, model="gpt-3.5-turbo"):
80
  """
81
- 使用 tiktoken 库根据 GPT 模型计算 token 数量。
82
  Claude 模型与 GPT 模型的 token 计算机制类似,因此可以使用 tiktoken。
83
  """
84
- # 临时禁用代理环境变量
85
- original_http_proxy = os.environ.pop('http_proxy', None)
86
- original_https_proxy = os.environ.pop('https_proxy', None)
87
 
88
- try:
89
- encoding = tiktoken.encoding_for_model(model) # 获取模型的编码器
90
- tokens = encoding.encode(text) # 对文本进行 tokenization
91
- return len(tokens)
92
- finally:
93
- # 恢复代理
94
- if original_http_proxy:
95
- os.environ['http_proxy'] = original_http_proxy
96
- if original_https_proxy:
97
- os.environ['https_proxy'] = original_https_proxy
98
 
99
  @app.route('/')
100
  def root():
 
27
  transport = requests.Session()
28
  transport.proxies.update(proxies)
29
  else:
 
30
  transport = None
31
 
32
  sio = socketio.Client(http_session=transport, logger=True, engineio_logger=True)
 
77
 
78
  def calculate_tokens_via_tiktoken(text, model="gpt-3.5-turbo"):
79
  """
80
+ 使用 tiktoken 库根据 GPT 模型计算 token 数量,支持从本地加载编码器文件。
81
  Claude 模型与 GPT 模型的 token 计算机制类似,因此可以使用 tiktoken。
82
  """
 
 
 
83
 
84
+ # 手动加载本地的 tiktoken 编码器文件
85
+ encoding_path = "/app/cl100k_base.tiktoken" # 本地路径
86
+ with open(encoding_path, "rb") as f:
87
+ encoding = tiktoken.Encoding.load(f) # 加载本地编码文件
88
+
89
+ tokens = encoding.encode(text) # 对文本进行 tokenization
90
+ return len(tokens)
 
 
 
91
 
92
  @app.route('/')
93
  def root():