情報学概論2 第5回(5/19)

(Introduction to Informatics 2)

事務連絡

ファイル 種類 拡張子(2)

JPGの中
PDFの中

1 PDFファイル

(前回のおさらいと補足)

e. PDFでページ検索・コピペ

(文字としてのデータの扱われ方)

実験:

(前回資料のページをPDF化したものを以下にいくつか置いておきますのでこれで試してもらってもOKです。)

印刷 228
Pandoc 168
Typora 669
キャプチャ 2798
  1. Windowsの印刷機能(Shift+Ctrl+P からプリンタとして pdf writerを選ぶ)

  2. pandoc + wkhtmltopdf

  3. Typora(Markdown用エディタ + 内部でpandoc)

  4. フルスクリーンキャプチャ画像からPDF化

  5. (ついでに作ってみた)ワープロソフト(LibreOffice)でHTMLからPDFにエクスポート

  6. (ついでに作ってみた) GIMPでインポートしてからエクスポート(単一ページ)

  7. 当科目についてこんなファイルもあります(取り扱い注意)

実験2:

(最近はpdf writerが高度になってきて 比較的問題を起こさなくなってきているので、別の実験も行いましょう)

解説と補足:

f. 拡張子が違ったら(または、ついていなければ)

2 DOCXファイル

a. 作成

b. DOCX の実体

実験:

  1. DOCXファイル(大事なファイルならばコピーしたものを使う)の、拡張子をzipに変更し、
  2. それを解凍してみる。 Officeのファイル形式変遷 その結果どんなファイルができているか中を覗いてみて下さい。

c. テンプレートの活用(pandocの小技)

  1. テンプレートを作成

    pandoc --print-default-data-file reference.docx > reference.docx
  2. word(など)でそのスタイルを編集(右図参照) スタイルの使用

    reference.docx
  3. テンプレートを使用

    pandoc ソースファイル -o 出力先.docx --reference-doc reference.docx

実験してみてください

  1. 手元にある画像ファイルの
    拡張子を変えて 開いてみる
      (たとえば jpg<->png)
  2. それを 拡張子判別アプリorサイト
    に 食わせてみる
  3. 手元にある DOCXの 拡張子を
    .zip に変えて開いてみる

3. 課題

  1. 今日の内容について

  2. アンケートの試み(実験として)