Pandoc で特定のディレクトリ直下にある複数のWordをMarkdown形式に一括変換する では、pandoc の--extract-media
オプションをオンにしても word 内部の画像を抽出することができなかった。
だが、Google Drive を使うことで Word 内部の画像を抽出することができたのでここに記しておく。
- 対象の Word ファイルを Google Drive にアップロードする
- そのファイルを Google Docs で開く
File → Download → Web Page (.html, zippted)
でウェブページとして zip ファイルをダウンロードする- zip ファイルを解凍後、その中にある
images
フォルダに Word 内部の画像が格納されている