Spaces:

Sabbah13
/

text_transcribation_diarization_and_summarization

Paused

App Files Files Community

Sabbah13 commited on Jul 2

Commit

350d733

•

1 Parent(s): ab98593

Update app.py

Browse files

Files changed (1) hide show

app.py +41 -9

app.py CHANGED Viewed

@@ -6,22 +6,48 @@ import streamlit as st
 import whisperx
 import torch
-def convert_segments_to_text(data):
     result = []
     for segment in data['segments']:
         words = segment['words']
         current_speaker = None
         current_start = None
         current_end = None
         current_text = []
         for word_info in words:
-            print('Word info: ')
-            print(word_info)
-            word = word_info['word']
-            start = word_info['start']
-            end = word_info['end']
-            speaker = word_info['speaker']
             if current_speaker is None:
                 current_speaker = speaker
@@ -32,7 +58,10 @@ def convert_segments_to_text(data):
                 current_end = end
             else:
                 # Finish current segment
-                formatted_text = f'{current_speaker} ({current_start} : {current_end}) : {" ".join(current_text)}'
                 result.append(formatted_text)
                 # Start new segment
@@ -43,7 +72,10 @@ def convert_segments_to_text(data):
         # Append the last segment
         if current_text:
-            formatted_text = f'{current_speaker} ({current_start} : {current_end}) : {" ".join(current_text)}'
             result.append(formatted_text)
     return '\n'.join(result)

 import whisperx
 import torch
+def convert_segments_object_to_text(data):
     result = []
     for segment in data['segments']:
         words = segment['words']
+        segment_speaker = segment.get('speaker', None)
+        segment_start = segment.get('start', None)
+        segment_end = segment.get('end', None)
         current_speaker = None
         current_start = None
         current_end = None
         current_text = []
+        # Forward fill speaker, start and end if missing
+        for i, word_info in enumerate(words):
+            if 'speaker' not in word_info:
+                if i > 0 and 'speaker' in words[i - 1]:
+                    word_info['speaker'] = words[i - 1]['speaker']
+                elif i < len(words) - 1 and 'speaker' in words[i + 1]:
+                    word_info['speaker'] = words[i + 1]['speaker']
+                else:
+                    word_info['speaker'] = segment_speaker
+            if 'start' not in word_info:
+                if i > 0 and 'end' in words[i - 1]:
+                    word_info['start'] = words[i - 1]['end']
+                else:
+                    word_info['start'] = segment_start
+            if 'end' not in word_info:
+                if i < len(words) - 1 and 'start' in words[i + 1]:
+                    word_info['end'] = words[i - 1]['start']
+                elif i == len(words) - 1:
+                    word_info['end'] = segment_end
+                else:
+                    word_info['end'] = word_info['start']
         for word_info in words:
+            word = word_info.get('word', '')
+            start = word_info.get('start', None)
+            end = word_info.get('end', None)
+            speaker = word_info.get('speaker', None)
             if current_speaker is None:
                 current_speaker = speaker
                 current_end = end
             else:
                 # Finish current segment
+                if current_start is not None and current_end is not None:
+                    formatted_text = f'{current_speaker} ({current_start} : {current_end}) : {" ".join(current_text)}'
+                else:
+                    formatted_text = f'{current_speaker} : {" ".join(current_text)}'
                 result.append(formatted_text)
                 # Start new segment
         # Append the last segment
         if current_text:
+            if current_start is not None and current_end is not None:
+                formatted_text = f'{current_speaker} ({current_start} : {current_end}) : {" ".join(current_text)}'
+            else:
+                formatted_text = f'{current_speaker} : {" ".join(current_text)}'
             result.append(formatted_text)
     return '\n'.join(result)