Apache TikaはJava製のドキュメント分析およびメタデータ抽出ツールです。 Apache Tikaを使ってみる 環境はOSX 10.10.2, Javaは1.7です。 Downloadからjarをダウンロードし … 続きを読む
2015/04/05
から admin
0件のコメント
2015/04/05
から admin
0件のコメント
Apache TikaはJava製のドキュメント分析およびメタデータ抽出ツールです。 Apache Tikaを使ってみる 環境はOSX 10.10.2, Javaは1.7です。 Downloadからjarをダウンロードし … 続きを読む
2013/12/22
から admin
1件のコメント
2013年に読んだ本が188冊でした。ハードカバー以外の本は全て裁断してスキャナでPDF化する所謂、自炊をしています。 来年の目標のひとつはOCR化して全文検索エンジンでこれらをIndexingしてキーワードで全文検索で … 続きを読む