ChatGptは、より現実的で詳細な画像作成のためにGPT-4Oを統合します

Openaiは、GPT-4Oモデルを搭載した高度なAIイメージ生成機能を導入するChatGPTの重要な更新を発表しました。この拡張により、ユーザーはCHATGPTインターフェイス内でより現実的で詳細な画像を直接作成し、プラットフォームのマルチモーダル機能を拡張できます。

「オムニモーダル」AIモデルであるGPT-4Oの統合は、ChatGPTの機能における極めて重要な進歩を示しています。 GPT-4oは、テキスト、画像、ビデオ、オーディオなど、さまざまな形式のメディアを処理および生成するように設計されています。このモデルは、以前のDALL-E 3をChATGPT内のデフォルトの画像生成エンジンとして置き換え、ユーザーが複雑な画像とコヒーレントテキストを作成するための拡張ツールを提供します。

GPT-4oを使用すると、ChATGPTユーザーが属性のバインディングとテキストレンダリングを改善した画像を生成できるようになりました。これは、AIが、会社のロゴ、スライドデッキ、その他の詳細なグラフィックの作成など、ユーザープロンプトをより正確に反映するビジュアルを作成できることを意味します。画像生成に対するモデルの自己回帰アプローチは、より良いテキストと拘束力のある機能に貢献し、高品質の出力を確保します。

新しい画像生成機能は、さまざまなサブスクリプション層のすべてのChATGPTユーザーに展開されています。フリー層ユーザーはこの機能にアクセスできますが、使用制限があります。 Openaiは、生成された画像には、AIの起源を示すデジタルマーカーが含まれ、倫理的ガイドラインとAI生成コンテンツの透明性と整合することを強調しています。

Openaiは持っています実装画像生成機能の誤用を防ぐための堅牢な保護手段。このシステムは、アーティストの権利を尊重し、生きているアーティストの作品を直接模倣する画像の作成を避けるように設計されています。さらに、実際の人々、ヌード、またはグラフィックの暴力を含む画像を生成することには制限があります。公人にはこの機能をオプトアウトするオプションがあり、同意なしに肖像が使用されないようにします。

提案された読み：Pika 2.1は、リアルなビデオ作成のための現実的な物理学とダイナミックな照明を発表します

GPT-4OのChATGPTへの統合は、AI駆動型コンテンツ作成における重要な前進を表しています。 Chatインターフェイス内で詳細で現実的な画像を生成する機能をユーザーに提供することにより、OpenAIは、ビジネスプレゼンテーションからクリエイティブプロジェクトまで、さまざまなドメイン全体のChatGPTの汎用性と適用性を高めます。

ソース：ネオウィン