表題の通り、Pandocを使って、特定ディレクトリ配下にある複数の Wordファイル(*.docx) を Markdownファイル(*.md) へ一括変換したい。
単一Wordファイルの変換コマンド
単一の変換である場合は、@tomo-makes さんのWordファイル(.docx)をMarkdownへ変換する を参考に実行すると良いと思います。
自分は特に困らなかったので、despan の処理は省いた形にしました。
また、--extract-media をオンにして指定しても Wordファイル内の画像を上手く抜き出せなかったです。
WordファイルからMarkdownファイルへの完全変換って難しい。まさに餅をもち米に戻す行為に近い…
pandoc -s {input}.docx --wrap=none -t gfm -o {output}.md複数Wordファイルの変換コマンド
ワンライナーのシェルスクリプトを組んで実行する。 実行時には、変換元のWordファイルが配置されているディレクトリで実行する。
for f in *.docx; do pandoc -s "$f" --wrap=none -t gfm -o "${f}.md"; done"${f}.md" の部分を "../../docs/${f}.md" のような形で修正してやれば、所定のディレクトリへ変換されたMarkdownファイルが生成される。