From 4176da0d686d7d91c37b821ee2173f2274d20d01 Mon Sep 17 00:00:00 2001
From: Guillaume Klein <guillaume.klein@systrangroup.com>
Date: Thu, 9 Mar 2023 09:58:58 +0100
Subject: [PATCH] Rename offset to seek to match the OpenAI implementation

---
 faster_whisper/transcribe.py | 20 +++++++++-----------
 1 file changed, 9 insertions(+), 11 deletions(-)

diff --git a/faster_whisper/transcribe.py b/faster_whisper/transcribe.py
index ebc1272..32eeeb2 100644
--- a/faster_whisper/transcribe.py
+++ b/faster_whisper/transcribe.py
@@ -238,7 +238,7 @@ class WhisperModel:
 
     def generate_tokenized_segments(self, features, options):
         content_frames = features.shape[-1] - self.feature_extractor.nb_max_frames
-        offset = 0
+        seek = 0
         all_tokens = []
         prompt_reset_since = 0
 
@@ -247,13 +247,11 @@ class WhisperModel:
             initial_prompt_tokens = self.encode_text(initial_prompt)
             all_tokens.extend(initial_prompt_tokens)
 
-        while offset < content_frames:
-            time_offset = offset * self.feature_extractor.time_per_frame
-            segment = features[
-                :, offset : offset + self.feature_extractor.nb_max_frames
-            ]
+        while seek < content_frames:
+            time_offset = seek * self.feature_extractor.time_per_frame
+            segment = features[:, seek : seek + self.feature_extractor.nb_max_frames]
             segment_size = min(
-                self.feature_extractor.nb_max_frames, content_frames - offset
+                self.feature_extractor.nb_max_frames, content_frames - seek
             )
             segment_duration = segment_size * self.feature_extractor.time_per_frame
 
@@ -283,7 +281,7 @@ class WhisperModel:
 
                 if should_skip:
                     # fast-forward to the next segment boundary
-                    offset += segment_size
+                    seek += segment_size
                     continue
 
             tokens = result.sequences_ids[0]
@@ -325,13 +323,13 @@ class WhisperModel:
 
                 if ended_with_single_timestamp:
                     # single timestamp at the end means no speech after the last timestamp.
-                    offset += segment_size
+                    seek += segment_size
                 else:
                     # otherwise, ignore the unfinished segment and seek to the last timestamp
                     last_timestamp_position = (
                         tokens[last_slice - 1] - self.timestamp_begin_id
                     )
-                    offset += last_timestamp_position * self.input_stride
+                    seek += last_timestamp_position * self.input_stride
 
                 all_tokens.extend(tokens[: last_slice + 1])
 
@@ -346,7 +344,7 @@ class WhisperModel:
 
                 yield time_offset, time_offset + duration, tokens
 
-                offset += segment_size
+                seek += segment_size
                 all_tokens.extend(tokens)
 
             if not options.condition_on_previous_text or temperature > 0.5: