= 添付資料に含むパソコンのスクリーンショットの画像ファイルについての説明/告訴状作成の下書き

= 添付資料に含むパソコンのスクリーンショットの画像ファイルについての説明

2015-05-04 月曜日 11:22 >> [[ ←これからの記述範囲の開始時刻 (VM)]]>>

これまでも本書において本文中になんどかご説明を書いてきたように思うのですが、その私の記憶も定かではなくなり、どこで書いたのかも探しだすのは容易ではなさそうなので、改めて独立した項目として書いておきたいと思います。

だいぶん前からになりますが、Ubuntuの環境では「% h-scrot-esc.rb」という自作のスクリプトのコマンドを使って、スクリーンショットを記録してきました。

このスクリプトでは事前に別のコマンドで記録したウィンドウをアクティブな最前面にして、そこでスクリーンショットを実行し、jpgの画像ファイルを指定したディレクトリに保存します。

この時、ファイル名には「2015-05-04_105857_」というようなコマンド実行時の日付と時刻の情報を先頭に、その続きの文字列は事前にマウス操作で範囲選択されていた文字列を使いますが、71文字を超える分は切り捨て、それにjpgという拡張子を付けたものを自動で生成します。

さらにこのコマンドでは決まりきった作業の手間を省くため、非常上告-最高検察庁御中_ツイッター(@s_hirono)に画像付きツイートで投稿するようにしています。この時、ツイートの文字の投稿内容はスクリーンショットのファイル名のみです。

保存先として指定したディレクトリは「~/kk_hirono/告訴状の内容に関連したスクリーンショット/」です。補完がききづらい日本語をパスの名前に加えるのは個人的に嫌いなのですが、わかりやすくすることを優先しました。

パスの頭にチルダがあるのはホームディレクトリの指定になりますが、これはホームディレクトリの直下に作ったシンボリックリンクです。実体は別のパーティションにあり、それもWindows8の環境と共有できるものにしています。私のWindows8の環境ではFドライブがそれになります。

Windows8の環境でも実体の同じ「告訴状の内容に関連したスクリーンショット」というフォルダにスクリーンショットを実行した画像ファイルを保存するようにしていますが、Twitterへの投稿までは自動でやっていません。

仮想マシンのUbuntuの環境に移って手作業でTwitterへの画像付きツイートの投稿をやるようにしていますが、忘れずにコマンドの実行をすれば結果は同じです。忘れずにという前提条件がつくので、間違いが起こる可能性もあるかと思います。

「/kk_hirono/告訴状の内容に関連したスクリーンショット/」のフォルダではPicasaウェブアルバムへの投稿が済んだものを、例えば2015年5月というその日付のフォルダに移動させるようにしています。

以前はスクリプトで自動化をさせていたのですが、違う面倒も出てきたので今は手作業でやっています。ブラウザでPicasaウェブアルバムでアルバムのページを開いて写真の追加をやっています。

PicasaウェブアルバムはGoogleの古いサービスでだいぶん前からGoogle+の写真サービスと同じになっているのですが、操作性の違いだけではなくややこしいところがあって、私はいまだにPicasaウェブアルバムで管理することがほとんどです。

ブラウザのPicasaウェブアルバムのページでも検索の機能はほとんど使い物にならない感じです。他のGoogleのサービスにもありがちなことですが、日本語の取り扱いや対応に不十分な点がいまだに残っているようです。

幸いなことにLinuxではなさそうなのでgoogleclというコマンドが簡単にインストール出来て使えるので、次のようにコマンドを実行しました。なぜかコマンド名はgoogleになっています。

% google picasa list-albums|grep 告訴状の内容に関連したスクリーンショット

複数のGoogleアカウントを使う場合は「% google picasa –user hirono2013k list-albums」というようにユーザの指定をオプションに加えます。

今回はgrepコマンドで絞りこみを掛けました。次の一覧がその結果です。アルバムのタイトルとURLの情報です。デリミタ(区切り記号)がカンマになっていますが、これは豹計算ソフトで扱うcsv形式かと思いますが、この区切り記号もオプションで変更が出来たかと思います。

告訴状の内容に関連したスクリーンショット 2015年5月分,https://picasaweb.google.com/105782624485753679454/20155
告訴状の内容に関連したスクリーンショット 2015年3月分,https://picasaweb.google.com/105782624485753679454/20153
告訴状の内容に関連したスクリーンショット 2015年4月分,https://picasaweb.google.com/105782624485753679454/20154
告訴状の内容に関連したスクリーンショット 2015年2月分,https://picasaweb.google.com/105782624485753679454/20152
告訴状の内容に関連したスクリーンショット 2015年1月分,https://picasaweb.google.com/105782624485753679454/20151
告訴状の内容に関連したスクリーンショット 2014年12月分,https://picasaweb.google.com/105782624485753679454/201412
告訴状の内容に関連したスクリーンショット 2014年11月分,https://picasaweb.google.com/105782624485753679454/201411
告訴状の内容に関連したスクリーンショット 2014年10月分,https://picasaweb.google.com/105782624485753679454/201410
告訴状の内容に関連したスクリーンショット 2014年9月分,https://picasaweb.google.com/105782624485753679454/20149
告訴状の内容に関連したスクリーンショット 2014年5月分,https://picasaweb.google.com/105782624485753679454/20145
告訴状の内容に関連したスクリーンショット 2014年6月分,https://picasaweb.google.com/105782624485753679454/20146
告訴状の内容に関連したスクリーンショット/2014年4月27日から同年5月8日分,https://picasaweb.google.com/105782624485753679454/201442758

なお、スクリーンショットのファイル名では、ファイル名に使えない文字やプログラムの処理で問題を起こす可能性のある特殊文字を、半角の文字から全角の文字に変換する処理をスクリプトで行っています。本来プログラムでは半角の英数字のみが固有の働きをするからです。

半角と全角では文字コードが異なるので全くの別物になります。Windowsのパソコンならそういうことはないと思いますが、以前、Ubuntuで使っていたATOK X3 for Linuxでは、フォントの関係で全角と半角の数字の区別がつきにくいということもありました。

全角と半角の違いは検索の場面でうまくいかない原因になりうるかと思います。あえてファイル名に日本語を使っているのも、検索の利便性を高めるためなのですが、ファイル名には使えない文字がいくつかあります。

本来使えない記号でもバックスラッシュ(Windowsの環境では半角の円記号)でエスケープすることで使えることもあるのですが、あとあと困ることもあるのでそういうこともしないようにしています。ただ標準のアプリでも半角のスペースや半角のコロンを使うものは多いです。

私がUbuntuで使っているスクリーンキャストのアプリでも標準で保存されるファイル名が「Screencast 2015-05-03 11:33:06.mp4」です。

シェルでファイル名の補完をすると「Screencast\ 2015-05-03\ 11\:33\:06.mp4」という感じになります。

このファイル名を探すためにネイティブのUbuntuに移っていたのですが、さきほど仮想マシンのUbuntuに戻ったところです。保管するところを再現しようとしたのですが、なぜかエラーが出て作成できず、Windows8のCygwinの方で作成をしました。

時刻は5月5日9時43分になっています。すぐにWindows8に戻るつもりだったのですが、今朝までネイティブのUbuntuで作業をしていました。昨夜は記録的なぐらいの数、ブログへの投稿をしたように思います。

WordPressのブログは数あるブログサービスのなかでも例外的なぐらいに制約がなく、一つの記事のデータ量にも制限がないという情報を見たことがあります。試験的に大きなデータ量の投稿をやったことがあるのですが、時間を掛けて投稿は完了したものの、その記事を開くことは出来ませんでした。

タイトル名の長さも調べてはいませんが、常識を超えて長いものでもいけそうな感じです。WordPressに関してはほぼエラーのことを気にせずに投稿をしています。

ブログのサービスでは個別に独自の制約があることが多く、それも実際に使い込んでみないとわからないものが多いです。以前、今のwordpress.comのブログと同時投稿をしていたBloggerは、APIでの投稿が一日に30件を超える辺りで、エラーが出ていました。

APIでのエラーが出た後も、通常のブラウザの投稿画面からは投稿ができていましたが、投稿をするたびに絵文字の識別認証が必要になっていました。

何ヶ月前になるのかはっきりとは思い出せないですが、ブログのページを開こうとするとエラーが出て、ブログが存在しないようなメッセージが出ていました。メールでの通知を確認するとAPIからの投稿数が多く、スパムと認定されたらしく警告も何もなしにブログを削除されていました。

APIでの投稿数もひと頃よりは少なくなっていてAPIでエラーを出すこともなかったのですが、中東での問題の報道がピークのような時期で、Googleの社員が脅迫を受けているというニュースもテレビでやっていたので、過剰な対応のあおりをあるいは受けたのかもしれません。

BloggerはYouTubeと同じくGoogleのサービスです。BloggerはGoogleのブログサービスですが、Googleのネットサービスは他に写真画像のPicasaウェブアルバムやメールのGmailがあります。

アカウント自体を削除されてしまっては全部のサービスに及び、影響ははるかに大きいです。これがその後の流れに影響を与え、紆余曲折をへて現在に至っています。

Bloggerの代わりに同時投稿をするようにしたのがHatena::Diaryのサービスです。ブログではありますが、他のブログとは仕組みがいくらか異なって点もあって、同じ「はてな」には後発の「はてなのブログ」もあるので、厳密に言えばブログとは違っているのかもしれません。

はてなダイアリーは、日記形式で、ある日付を一つのファイルかデータとして管理する仕組みになっています。同じ日の記事はそれぞれが、同じファイル中の見出しのような扱いにもなっています。

データベースではその一日分を一つのデータとして管理されているものと想像されるのですが、一定量の文字数を超えると、警告も何もなしに限度を超えた分が切り捨てられるという、いささかやっかいな特徴があります。

以前、ネット上で調べてもそれらしい情報は見つからなかったのですが、実際に経験してきたことです。普通に使っていればまず問題にならないようなデータ量の設定になっているのだと思いますが、はっきりした限界がわからないので、一日分の投稿量が多くなると気になってきます。

私の想像ではデータベースののデータ型による制限かと思われるのです。小さいサイズのテキスト用のデータ型で最長65,535バイトのようですが、MySQLだとこれより大きいデータ型が2段階あるようです。

時刻は14時45分です。宇出津新港に買い物に行ったり、中断をしていました。調べたところ、はてなダイアリーの投稿文字数制限は約6万5千文字という情報がありました。

次のコマンドで昨日分の投稿データを一つのファイルとしてまとめました。→ % cat c投稿済み/20150504_*.txt > /media/sf_share/w.txt

Linuxのwcというコマンドでは行数と単語数、それとバイト数しか調べることが出来ないようでした。Windows8のPowerShellで調べる方法があったのでやってみたところ、「Characters : 58767」という結果が出ました。やがて6万文字に近いようです。

はてなダイアリーの場合、他にも問題はあります。一日の開始時刻が0時ではない可能性があることです。数年前はそうだったように思います。6万5千というのもバイト数ではないかと思われ、バイト数は文字コードによっても違ってくるのではと思われます。

今、はてなダイアリーのブログのページでソースコードを開き確認をしたのですが、文字コードは今でも「charset=euc-jp」という指定になっていました。

どうも5月4日の投稿が特に多かったと思っていたのですが、データ量というか文字数では5月3日分の方が多いらしいということがわかりました。同様にPowerShellで調べたところ、「Characters : 89821」という結果が出ました。9万文字に近いという数字のようです。

ファイルサイズでは5月4日分が65Kバイトだったのに5月3日分が85Kバイトになっていたのでわかったのです。これはEmacsではてなダイアリー関連のパッケージを使うようにしたことでわかったものです。

「M-x hatena-get-webdiary」というコマンドを実行することで「~/.hatena」というディレクトリにネット上の全てのデータが日付ごとに一つのファイルとして保存されました。

時刻は5月8日9時44分です。けっこう長い中断をしていました。告発-金沢地方検察庁御中_ツイッター(@kk_hirono)で5月5日15時22分以来の再開になります。

この間も、これからどのように書いていくかいろいろと考えていたのですが、見出しをつけた項目はなるべくコンパクトに小分けをしていきたいと思います。これは読む側の人への配慮もありますが、書いている私自身も何をどこでどの程度書いたのか状況を把握しておくためです。

はてなダイアリーについても説明の必要性を考えるところで書いておきたいことがあり、独立した取り扱いにしておきたいところです。

小倉秀夫弁護士との関係においても少し変化があったというか、向こうから返信に近いツイートがあったので、早急に取り上げておきたいことがあります。連休もあっけなく終わったという感じです。それも私の中では意識していた節目の一つです。

2015-05-08 金曜日 10:01 << [[ ←これまでの記述範囲の終了時刻 (VM)]]<<

[2015-05-04 11:20]