受動態を能動態に変換して強力なビデオスクリプトを作る方法
出版 June 05, 2026~2 min read

受動態を能動態に変換して強力なビデオスクリプトを作る方法

ビデオスクリプトを強化するために受動態から能動態に変換する方法

「ダビングはAIエンジンによって完了されました。」

「当社のAIエンジンはあなたのダビングを数分で完了します。」

同じ情報です。反対の効果があります。最初の文は背景ノイズのように視聴者を素通りさせます。2番目の文は行動者をドライバーシートに置き、期限をテーブルに置きます。YouTubeやeラーニング、プロダクト説明、企業研修用のビデオスクリプトを書く場合、このギャップがエンゲージメントの生死を分けます。また、受動態から能動態への変換ツールは自動的には修正できません。変換の最も難しい部分は、アルゴリズムが確実に行うことができない判断だからです。

ビデオは既に消費者インターネットトラフィックの80%以上を占めており、シスコ年次インターネットレポートによると、Facebookビデオの85%が音声なしで視聴されています。DigidayのレポートによるFacebookの内部データから。音声がミュートされたり、キャプションが付いたり、視聴者の母語に自動ダビングされたりするとき、スクリプトの明確性は重要な役割を果たします。このガイドの終わりまでに、4段階の変換ワークフロー、受動態が残るべき場合の決定マトリックス、および次のスクリプト用の10分間の監査チェックリストが手に入ります。

机にいるクリエイター、デュアルモニターが見える — 左画面はハイライトされたテキスト付きのスクリプトドキュメントを表示、右画面はビデオエディタータイムラインを表示。暖かいオーバーヘッドライティング、マグカップ、手書き編集が見える必記。やや上からの角度。

目次


受動態がビデオスクリプトのエネルギーを奪う理由

スクリプトライターにとって、受動態は正確な構造定義を持っています。行為の受け手が主語の位置にいる文です。通常、「to be」の形(is、are、was、were、being、been)+過去分詞で構成されています。プロフェッサー・スコットの英文法はこのように説明し、実用的な含意を追加しています。受動態は行為者を動詞の後に置くことが多いか、行為者を完全に省略することが多いため、文が曖昧または不完全に感じられます。

実際のクリエイターコンテキストからの3つのビフォー・アフター例は、構造的な問題を明確にします。

  1. YouTubeチュートリアル:「エクスポート設定はメニューにあります」→「エクスポート設定はメニューで見つけることができます。」
  2. プロダクト説明:「あなたのビデオは当社のエンジンにより33言語にダビングされます」→「当社のエンジンはあなたのビデオを33言語にダビングします。」
  3. eラーニングイントロ:「このモジュールはプロジェクト計画を教えるために設計されました」→「このモジュールはあなたにプロジェクト計画を教えます。」

各書き直しは同時に3つのことを行います。行為者に名前を付け、1語か2語カットし、視聴者が精神的に追跡する行為者を与えます。

これの背後にある心理学はよくマップされています。スティーブン・ピンカーは『スタイルの感覚』で、優れた散文は明確な行為者と行動を伴う視覚化可能なシーンを提示していると主張しています。読者(と視聴者)は、主語が行為者である場合、イベントをより簡単に精神的にシミュレートします。『ブラックスロー法律辞書』の編集者であるブライアン・ガーナーは、法律執筆の観点から同じことを主張しています。能動態は誰が何に責任があるかについての曖昧さを減らします。能動態が連邦コンプライアンス文書および契約草案の標準である場合、YouTubeのイントロの標準であるべきです。

ローカライゼーション上の賭け金は、AIダビングをワークフローで使用している人に特有です。CSA Researchの「読めない、買わない」研究は、消費者の76%が自分の言語での情報を持つ製品の購入を好むことを発見しました。また消費者の40%は他の言語のウェブサイトから購入しません。その後の研究では、品質が低い場合でも、消費者の65%がネイティブ言語のコンテンツを好むことがわかりました。YouTubeクリエイター・アカデミーのデータによると、典型的なクリエイターの視聴時間の60%以上は彼らの母国外からのものです。

ソーススクリプト内の受動態は、すべての33の対象言語にわたるダビング版での受動的なエンゲージメントになります。

その理由は業務的です。ほとんどのAIダビングエンジンは逐語的に翻訳します。曖昧で行為者のない英語の文は、曖昧で行為者のないスペイン語、標準中国語、またはアラビア語の文になります。弱さはあなたが出荷するすべての言語に渡って複雑になります。さらに悪いことに、1行あたり約42文字で毎秒約17文字の読度が上限のサブタイトル行 — Netflixタイムドテキストスタイルガイドの標準 — は、冗長な受動構文の余地を残しません。フレームをオーバーフローして、自動的に切り詰められるか、視聴者に不快な速度で読むことを強制します。

米国平易言語ガイドラインはこれを連邦通信の法則にします。庁舎は公式に国民との明確な通信のために能動態を使用することが必要です。政府のコンプライアンス文書が能動態を傾ける場合、プロダクト説明が確実に傾けるべきです。


声優に到達する前に受動態を見つけるための7つのシグナルチェックリスト

変換する前に、認識する必要があります。受動態は平然と隠れています — 特に2番目の草稿では、文の音調は既に滑らかにしていますが、構造はしていません。これら7つの診断シグナルを使用して草稿をスキャンしてください。いくつかについては、Ctrl+F(Macではcmd+F)が作業を行います。

黄色でハイライトされた3つの文を含むGoogleドキュメントスクリプトのスクリーンキャプチャ。マージンのコメント吹き出しは「受動態」とタグ付けし、矢印を付けています。視認可能なカーソルは編集中です。スクリプトのトピックはYouTubeチュートリアル「エクスポート方法」です
  1. 「to be」+過去分詞パターン。is、are、was、were、be、been、beingの後に-edまたは-enで終わる動詞が続くことをすばやく検索します。例:「was completed」、「is rendered」、「are uploaded」。これは単一の最も信頼できる診断です — 脚本家のチートコードは、スクリプト監査で最初にスキャンすることをお勧めしています。
  2. 「by [agent]」のシグナル。「by」の後に明らかに行為者である名詞が続く場合、文はほぼ確実に受動態です。「スクリプトはクライアントによって承認されました。」それを反転させます。「クライアントはスクリプトを承認しました。」
  3. 行為者が完全に不在。「間違いは犯されました」— 誰によって?行為者が見えない場合、意図的に責任を隠しているか(時々有効; 以下の決定マトリックスを参照)、または偶然に曖昧です。ほとんどの場合、それは2番目です。
  4. 「got」または「gets」で隠れた受動態。「ビデオが一晩編集されました」は変装した受動態です。got + 過去分詞を探します。これらは多くの場合、スペルチェッカーや受動態プラグインさえも通り過ぎてしまいます。なぜなら、彼らは「to be」の形を使わないからです。
  5. アクションをマスクする名詞化。「私たちのチームによるフッテージの評価がありました」は動詞を名詞(「評価」)に埋めます。能動的な書き直し:「当社のチームはフッテージを評価しました。」9語から5語にカットし、行為者と行動の両方を明らかにしました。
  6. 最初の8語以内に明確な主語のない25語以上の文。早い段階で主語シグナルがない長い文は受動的ドリフトです。あなたの視聴者が8語までに誰が行動しているのかを知らない場合、彼らはすでにドリフトしすぎています。
  7. モーダル+「be」+過去分詞。「このステップはスキップできます」、「ファイルは保存する必要があります」、「フォームは完了する必要があります」。モーダル受動態は指示を弱めます — そして指示は正確に弱さを余裕がない場所です。

声優、テキスト音声変換エンジン、またはダビングワークフローに送信する前に、これら7つのシグナルを通してドラフトを実行します。ソーススクリプト内の受動態が少ないほど、ローカライズバージョンが各対象言語で必要とする編集が少なくなります。


任意の受動文に対応する4段階の変換ワークフロー

ほとんどの受動態から能動態への音声変換ツール — Junia、QuillBot、Grammarly — はステップ2と3をかなりよく自動化しますが、ステップ1である最も重要なステップでつまずきます。最初に手動ワークフローを実行してください。2回目のパスとしてツールを使用してください。

ステップ1:行為者(誰が、または何が行為をしているのか)を識別してください

質問は常にこうです。誰がこれをしましたか?誰がこれをしているのですか?答えが文の中にない場合、書き直す前に追加する必要があります — そうしないと、能動版は文法的に正しいが事実的に空になります。

  • テンプレート:[行為の受け手]は[過去分詞]によって[AGENT]でした → AGENT = あなたの新しい文の主語
  • スクリプト例:「サムネイルは一晩で再設計されました。」誰がそれを再設計しましたか?行為者を追加してください。「当社のエディターはサムネイルを一晩で再設計しました。」
  • 失敗ケース:ステップ1をスキップすると、「誰かがサムネイルを再設計しました」が生じます — 技術的には能動、物語的には役に立たない。Juniaのツールドキュメントによると、レビュアーは常に「マシンパス後に行為者を復元またはklarify」すべきです — これらのツールを構築する売り手でさえ、行為者識別ステップが人間の仕事であることを知っているという確認。

ステップ2:行為者を主語の位置に移動する

行為者がわかったら、文の前に置きます。

  • テンプレート:[AGENT] + [動詞] + [受け手]
  • スクリプト例:「車はトラックに衝突されました」→「トラックが車に衝突します。」単語数は6から4にドロップします — 約33%カット。脚本家のチートコードの実例から。

ステップ3:「to be」+過去分詞を強い能動動詞に置き換える

「was hit」は「hits」または「slams」になります。「was redesigned」は「redesigned」または「rebuilt」になります。アクションを視覚的に示す動詞を選択してください — ピンカーの「視覚化可能なシーン」の原則がここに直接適用されます。

  • テンプレート:「was [participle]」→ [現在形または過去形の能動動詞]
  • スクリプト例:「車はサラに運ばれました」→「サラは車を運転しました。」6語は3語になります。50%削減

ステップ4:残りの前置詞句をトリムする

反転した後、孤立した前置詞が残ることがあります。by、for、to、in。意味を追加しないものはカットしてください。これはあなたがWPM予算のための言葉を取り戻すところです — マーケティング用の140-160 WPMeラーニング用の120-140 WPMVoices.comのボイスオーバーガイダンスによる。

  • テンプレート:「by [agent]」フレーズと再構築後に残された前置詞の浮遊物を削除してください。
  • スクリプト例:「新しいセキュリティプロトコルは最後の四半期に当社のエンジニアリングチームによって実装されました」(12語、単一の42文字のサブタイトル行をオーバーフロー)→「当社のエンジニアリングチームが最後の四半期に新しいセキュリティプロトコルを実装しました」(9語、Netflixの1行あたりの上限の下に快適に適合)。

これら4つのステップを順番に実行してください。市場にある受動態から能動態への音声変換は、ステップ2~4を機械的に行います。何もステップ1を確実に行いません。これが人間のパスが重要である理由です — 特に、AIダビングAPIを通じて数十の対象言語にプッシュしようとしているスクリプトの場合。


受動態が正しい戦略的選択である場合 — 決定マトリックス

『ケンブリッジ英文法』の共著者ジェフリー・プラムは、「受動態を避ける」というアドバイスはしばしば膨らみすぎており、最初の場所で受動態を誤認識することに基づいていると主張しています。ミニョン・フォガルティ(「文法少女」)も同様に、すべての受動態を置き換えることに対して警告しています — 時々受動態は正しいツールです。このマトリックスを使用して決定してください。

シナリオ受動態を保持しますか?理由能動的な代替案
行為者が不明(「あなたのアカウントが危険にさらされました」)はいあなたはそれが誰がやったのかを知りません。行為者を発明すると誤解します「誰かがあなたのアカウントを危険にさらしました」— より弱い、情報利得がない
受け手が重要(「CEOは会長に昇進しました」)はい話は受け手についてであり、プロモーターについてではありません「取締役会はCEOを昇進させました」— 焦点をずらします
ポリシー言語(「払い戻しは14日以内に処理されます」)はい機関のフレーズ。標準的なポリシーとして読む「払い戻しを14日以内に処理します」— 良好、オプション
責任を和らげる(「間違いは犯されました」)時々PRまたはお詫びのコンテキストでの戦略的曖昧性「私たちは間違いを犯しました」— より強い、責任にコミット
科学的方法(「データは6ヶ月間にわたって収集されました」)はいAPAおよびSTEM慣例。手順に焦点を当てた「6ヶ月間にわたってデータを収集しました」— 受け入れられているがオプション
マーケティングCTA(「あなたのビデオは数分でダビングできます」)いいえ製品から能動性を奪う。提案を弱める「数分でビデオをダビングしてください」— よりパンチがある、行動指向
YouTubeイントロフックいいえエネルギーが最初の8秒で最も重要です「あなたはまさに学ぶつもりです…」— 視聴者を主語として

パターン:受動態はその場所を獲得します。受け手が行為者より本当に重要である場合、または行為者が不明、無関係、または政治的に敏感である場合。ほとんどのクリエイターコンテキスト — YouTubeイントロ、プロダクト説明、コースCTA、マーケティングボイスオーバー — では能動態が勝ちます。

コンテンツタイプで検証してください。

  • YouTubeと短い形式のソーシャル:積極的な書き直し。最も戦略的に必要な受動態を除いて、すべてをカットしてください。エンゲージメントウィンドウは短く、アルゴリズムは最初の30秒のリテンションに報酬を与えます。
  • 企業研修とeラーニング:選択的な書き直し。手順ステップで受動態を保持します。学習者の行動が行為者より重要である場所(「フォームは電子的に提出されます」)、すべてのCTA、すべての動機付けの行、「学ぶもの」フレーミングをフリップします。
  • ドキュメンタリーまたはナレーティブビデオ:混合。受動態は距離感、謎、歴史的な重さを伝えることができます(「条約は夜明けに署名されました」)— トーンが要求する場所でそれを保持してください。
最良の書き直しは最も能動的なものではありません — あなたの意図を保持しながら視聴者を動かすものです。

ルールは「すべての受動態を殺す」ではありません。ルールは次の通りです。スクリプト内のすべての受動態は、デフォルトではなく意図的な選択であるべきです。プラムの批評はここに着陸します。受動態が留まっている理由を明確に述べることができれば、それを保持してください。できなければ、反転させてください。


能動態の書き直しを33言語のダビングに対応させる

能動態は始点であり、終点ではありません — 特にスクリプトがダビングされる場合。パンチの効いた英語の行は、異なる語順、敬語慣例、または慣用句の速記を持つ言語に翻訳されるときに壊れることができます。これは能動態を書く方法です。移動する方法です。

左側のTTSインターフェイス(波形が見える、複数言語を示す言語ドロップダウン)と右側にハイライトされた能動態の書き直しを含むスクリプトを示す分割画面モニター。画面のクローズアップ角度。背景の仕事にわずかなボケ。
  • 可能な限り15語未満の文を保持してください。サブタイトルの読度速度は毎秒約17文字で、1行あたり約42文字です。短い能動文は言語全体でサブタイトルフレームにきちんと適合します — そして、マーケティング用の140-160 WPM、eラーニング用の120-140 WPMのボイスオーバーペーシング目標にヒットします。英語の22語の文は、翻訳後のスペイン語またはドイツ語では28~30語になることが多く、タイミング予算を大きく超えてしまいます。
  • 翻訳されない慣用句の能動構式を避けてください。「I'm going to knock your socks off」は英語で能動かつエネルギッシュですが、文字通りの標準中国語またはアラビア語ダビングで不合理を生じます。ユニバーサル動詞に置き換えてください。「何か信じられないことをお見せします。」能動そして移動可能。「それをくぎ付けにする」、「それを粉砕する」、「物事を開始する」、「戻って円を作る」に同じロジックが適用されます — 機械翻訳でノイズのように読む慣用句。
  • 一人称複数(「we」)より2人称主語(「you」)を好んでください。「3時間を節約します」は「3時間があなたによって節約される」より自然にダビングします — そして、多くの言語で複雑にする公式/非公式代名詞の分割を避けます(tu/usted、du/Sie、tu/vous)。2人称は、すべての文に対して組み込みの行為者も与えます。
  • 能動態をボイスオーバーの声優の明確性に一致させてください。Voices.comは、声優が「内部リズムと呼吸するための適切な場所」を伴うスクリプトを必要とすることに注意します。明確な行為者-動詞-物体構造を持つ能動文は、声優に自然な呼吸点を与えます。受動的な構造は節の途中に不自然な一時停止を強制し、ダビングアーティストはその後、読みに対抗する必要があります。これは、人間の声優またはテキスト音声APIで作業しているかどうかに適用されます。
  • 最終録音前にTTSで書き直しをテストしてください。声優の時間をコミットする前に、または音声クローニングセッション前に、テキスト音声エンジンを通じて修正されたスクリプトを実行してタイミング、リズム、ストレスパターンを聞きます。TTSで躓く場合、別の音韻に異なる韻律を持つダビング言語では、さらに躓きます。例えば、日本語は頻繁に英語に対して主語-動詞-物体の順序を反転させます。
  • 対象言語での統語的な強調を考慮してください。標準中国語、アラビア語、日本語、トルコ語はそれぞれ異なるSOV/SVO/VSO慣例を持っています。能動的な英語の文は、対象言語での強調を保持するために対象言語の受動構造が必要なことがあります。ソーススクリプト作成で、ローカライゼーションレビューで計画してください。英語での仕事は、行為者と行動を曖昧でなくすることです。ローカライゼーション編集者の仕事は、対象言語でその意図を保持することです。
ターゲット言語に対して慣用的すぎる能動態の文は、ローカライゼーションの目的を破棄します — 活動だけでなく普遍性のために書き直してください。

10分間のスクリプト監査 — 次の録音の前に適用してください

完成した草稿と期限があります。全体を書き直すだけの時間がありません — でも、あなたは10分を持っています。この監査を実行してください。修正する価値のある高インパクトの受動構式のすべてを明らかにし、どれを一人にするかを教えています。

木製の机の上の俯瞰図 — ラップトップを開く赤い打消し線とグリーン能動書き直しが表示されるスクリプト。いくつかのアイテムがペンでチェックされているプリント済みのチェックリスト。コーヒーマグ。小さなノート。暖かく自然な日光。

監査前(スキャン前に回答)

  1. このビデオの中核的なアクションは何ですか?(視聴、購入、サインアップ、学習、クリック。)あなたの能動的な書き直しはこの単一の動詞に合わせるべきです。
  2. 視聴者が行為者として認識する人は誰ですか?(あなた?彼ら?あなたの製品?)これはすべてのCTAと教育行のデフォルトの主語です。
  3. 現在のスクリプトで最も長い文は何ですか?20語以上の場合、それは受動候補の可能性があります。そこから始めましょう。

8項目のCtrl+F監査

  1. 「was」と「were」を検索します。過去分詞が続くすべてのインスタンスにフラグを立ててください。ほとんどは受動態です。一部は「to be」の正当な過去使用(「彼女は疲れていました」)になります。それぞれを判断してください。
  2. 「by」を検索(スペースに注意)。ほとんどのヒットは明示的なエージェントを持つ受動構式を明らかにします — 最も簡単に反転します。
  3. 「is being」、「are being」、「was being」、「were being」を検索します。継続的な受動態 — ほぼ常に書き直し可能でほぼ常に必要よりも冗長です。
  4. 「has been」、「have been」、「had been」を検索します。完全時制受動態は企業スクリプトと製品ドキュメントで一般的です。
  5. 「can be」、「should be」、「must be」、「will be」を検索します。モーダル受動態 — 通常、指示またはCTAを弱めます。「ファイルをエクスポートできます」はマーケティングが「1クリックでファイルをエクスポート」と比較して逃します。
  6. 「got」と「gets」を検索します。「got delivered」や「gets uploaded」などの隠れた受動態をキャッチしてください。
  7. 「there is」、「there are」、「there was」を検索します。名詞に作用を埋める説明的な構造。「プロセスにはステップがあります」または、より良い、「3つのステップを完了します。」
  8. 最初の文と最後の文を声に出して読んでください。これらはリテンションとリコールに過度な影響を与えます。どちらかが受動態の場合、再書き直してください — スクリプトの他の場所に受動態を保持していても。

ミニケース例

クリエイターの草稿は次のように開きます。「このビデオでは、最終カットをエクスポートするプロセスが説明され、最も一般的なエラーが対処されます。」24語で、2つの受動態、行為者が見えません。

監査を実行してください。

  • 「will be explained」→ 受動態(モーダル+be+分詞)
  • 「will be addressed」→ 受動態(同じパターン)
  • 明確な行為者がない — 「誰が[何]?」

4段階のワークフローを適用してください。

  • 行為者:I(ホスト)
  • 主語の位置:「I'll」
  • 能動動詞:walk you through、fix
  • トリム:「In this video」をカット

書き直し:「あなたが最終カットをエクスポートするのを指導し、ほとんどのクリエイターが犯す3つのエラーを修正します。」

16語。2つの能動動詞。視聴者の利益が明確。行為者(あなた、ホスト)が明確。約束(3つの特定のエラーを修正)が具体的。そしてこの行は、切り捨てなしに単一のサブタイトルフレームに適合します。

それが監査です。スクリプトごとに1回実行 — 10分、毎回。声優がより自然に読みます。サブタイトルフレームが保持されます。そしてあなたが音声クローニングAPIまたはダビングパイプラインを通してプッシュするあらゆるバージョンは、あなたが配送するすべてのターゲット言語に同じ清潔な行為者と行動の構造を含みます。