Videolanのオープンソースのビデオプレーヤーは60億のダウンロードに達しました。開発者は、CES 2025、AIが生成した字幕で新しい機能を発表することで、マイルストーンを祝いました。
字幕は、外国語である映画やテレビ番組を見たいとき、または聴聞会がある場合に役立ちます。しかし、字幕が常に見たいビデオでは常に利用できるとは限りません。また、ハードコーディングしたり、奇妙なフォントや色を使用したりすることがあります。さらに、インターネットユーザーのかなりの部分は、地元のメディアのサブタイトルを見つけ、ダウンロードし、統合する方法を知らない場合があります。
ライブキャプション
Windows 10とWindows 11には、ライブキャプションと呼ばれる機能があります。Windows + Ctrl + Lでアクセスできます。これは、YouTube、Netflix、その他のビデオストリーミングサイトのストリーミングビデオなど、あらゆるメディアに使用できる便利な機能です。確かに、正確な字幕を提供するのに苦労することもありますが、何もなく改善よりも優れています。 Android、iOS、MacOSには、同様のライブキャプション機能もあります。
たぶん、VLCのオフラインサブタイトルジェネレーターは、これに対するより良いソリューションになる可能性があります。しかし、そのような機能を紹介するのは最初ではありません。オープンAIのささやきを使用して字幕を生成する他のツールがあります。雰囲気または字幕。しかし、これらのアプリはユーザーフレンドリーなそれ自体ではありません。 VLCが構築したと思われるものは、より簡単な解決策になる可能性があります。
自動AIサブタイトリングおよびリアルタイム翻訳を取得するVLC
VLCのgitlabにはいくつかありますリクエストをマージしますビデオプレーヤーにスピーチツーテキストテクノロジーの実装に関連しています。 Whisperを使用しますが、Openaiのささやきモデルに依存していません。代わりに、VLCは使用しますwhisper.cpp、オープンAIのささやき自動音声認識(ASR)テクノロジーのCベースのフォーク。
もっと読む:AIトレーニングのためにYouTube字幕を使用しているApple、人類、およびNvidia
VideolanのAI字幕ツールは、オンラインサービスに接続せずにオフラインで動作します。つまり、アカウントやサービスの要件はありません。それはまた、それがプライバシーに優しいことを意味します。また、字幕を手動で検索し、ダウンロードし、ビデオ用に有効にする必要性も排除されます。
字幕を生成するだけでなく、さらに印象的なのは、VLCのAI機能もリアルタイムで字幕を変換することです。この機能は100以上の言語をサポートします。これにより、ユーザーはあらゆる言語のダイアログを理解できるようになります。あなたが旅行しているか、インターネットにアクセスしていないと想像してください。VLCはビデオの字幕を提供するだけでなく、オフラインで翻訳することもできます。それは驚くべきことです。この機能の要件は明らかにされていませんが、字幕を生成してそれらを翻訳するために必要なAIモデルを含むオプションのダウンロードが必要になる可能性があります。
VLCでのAI字幕はまだ利用できませんが、将来追加されます。発表ビデオを見ることができますVideolanのXアカウントそしてLinkedInページ。
最新バージョンを知っていましたかポットプレイヤーまた、自動字幕をサポートしていますか?また、ささやきモデルも使用します。

私はAmazon Prime Video Ai Recapを人工知能のクールな使用と呼びましたが、VLCのAI字幕の方がさらに良いと思います。これは、AIがプライバシーに侵入しない場合にAIがどのように有益であるかの別の例です。しかし、機能の成功は、生成された字幕の精度に依存します。うまくいけば、それは約束どおりに機能するでしょう。
