卒研メモ:Panama文書解析手法

 租税回避地(Tax Haven)を使っていたお金持ち達のやり取りを暴露したPanama文書が話題になっていますが,2.6TBもの文書を解析した手法について分かりやすく概説した方がいらっしゃいますので紹介しておきます。

「パナマ文書」解析の技術的側面

 RDBにするだけでは人物や会社との関係性が分かりづらいので可視化し,人力を借りつつ解析精度を上げていくという手法を取っているようです。技術的解説としては

Neo4j BlogAnalyzing the Panama Papers with Neo4j: Data Models, Queries & More

も必読とのこと。

 ここで取り上げられている可視化ツール類は卒研でも使えそうです。

卒研メモ:waifu2x体験

 日経ITProの記事で,Deep Learning技法を使った画像ノイズ除去ソフトウェアwaifu2xの紹介がありましたので,早速使ってみました。

 小さい元画像(浮世絵)をwaifu2xを使って2倍に拡大し,ノイズ除去も行ったものです。

元画像:
28

拡大画像:
28_waifu2x_art_noise3_scale

 確かに,不自然にのっぺりしていますがノイズが除去されていることが分かります。

 このWebサーバにインストールして使うこともできそうですから,誰か体験してみますか?

追記:Windowsで動作するwaifu2x-caffeなるものもあるようです。Deep Learning部分にCaffeを使っているとのこと。

卒研メモ:インターネットの歴史

 ちょろっと「インターネットの歴史」「History of The Internet」を検索するだけでも色々なサイトが出てきますが,Yahoo! Japanが作った絵物語風のものはなかなかいい出来です。

インターネットの歴史

 Yahoo!誕生から20年。時の流れは早いですね。当方も以前Web20周年誕生を記念して公開講座で講演したことがあります(資料PDF)。ざっくりとした歴史の流れをまとめると

2016-04-01_155100

という感じでしょうか。

 年寄りの回顧談は長くなるのでこの辺で。

卒研メモ:Caffeについて

 人工知能研究の一つに,ニューラルネットワークを利用したDeep Learningがあります。Caffeはそのソフトウェアフレームワークで,BSDオープンソースライセンスにて公開され,自由に使うことができます。今のところ,応用用途としてはWebのIFとして公開されている画像識別が主のようですが,ど素人が人工知能に触れつつその機能を理解するという用途には使えそうです。

 下記の画像は,このサイトのトップにある入道雲+やらまいか創造工学センターの屋上部分の写真をCaffeにかけてみたところです。完全に火山の写真と思われているようですが。

2016-03-22_121228

 ということで,ボツボツ原論文を読もうかなというところです。せっかくGPUが活用できる環境があるので,一台ぐらいはインストールしてcuDNNと格闘してみたいものです。誰かやってみませんか?

卒研メモ:VirusTotalの活用

 Googleは様々なサービスを展開していますが,VirusTotalもその一つです。ローカルのファイルだけでなく,URL先のファイルも,一度に多数のウィルス対策ソフトでチェックできます。

 メールで添付ファイルを送ったり送られたりするときには一度このサイトでウィルスが入っていないかどうか確認する習慣をつけてはどうでしょうか?

卒研メモ:堅い文章を書く際のチェックポイント

 就活,卒研等で「堅い文章」(「社会人が仕事で使う普通の文章」の意)を書く機会が増えていきます。下記のTweetに添付されたチェックポイントは堅い文章の「基本中の基本」ですので,確認しておきましょう。それ以前に「誤字脱字の確認」ぐらいは,Wordでもある程度はできるので,確実にしておきましょうね。

526実験室マシン Windows 10インストール

 526実験室(卒研用ルーム)のデスクトップマシン,Linuxマシン(cs-basshus)1台を除いて全てWindows 10化しました。来年度からDreamSpark Premiumが使えなくなりますので,使用権のある本年度のうちに変更して置く必要がありました。
 その一環として,古いPentium D 820, Core i3マシンはPhenom II X6, Core i7マシンに更新しました。

 MS Office 2010はまだ3台にしか入っていませんので,次年度以降に必要なライセンスを購入して順次Office 2016化していきたいと思います。

卒研メモ:技術系質問サイトの利用

 卒研を進めるにつれて技術的な困難に直面することが多くなります。その際には,同じ研究室のメンバーに相談,教員に相談,他の友達に相談・・・ということになるかと思いますが,相談する前にまずは「何を聞きたいのか?何が分からないのか?」ときちんと整理しておくと,聞かれる方も答えやすくなります。漠然とした疑問に大しては漠然とした回答しか得られません。

 最近ではYahoo!知恵袋等のQ&Aサイトが人気ですが,プログラミングテクニックを聞く場としては,専門家が集っているとは言えず,あまり適していないように思えます。2chもそこそこ使えますが,罵声も飛び交うし,的確な回答が得られる率はそう高くないでしょう。

 プログラミングに関しては,StackOverflowが先駆けとなり,日本語サイトもできました。最近ではTeratailというところも賑わっているようです(Internet Watch)。

 こういうところできちんとした文章で質問できるようになると,口頭でのやりとりもスムーズにできるようになります。人に理解してもらう方法論を学ぶ意味でも,積極的に活用して「疑問をまとめて的確な回答を引き出す」テクニックを身につけて下さい。

Google Analyticsに対応

 WordPressのPluginを使ってGoogle Analyticsに対応してみました。アクセス数が少ないので,まだちゃんとした分析はできていませんが,数か月すると少しは傾向が判明してくるのではないでしょうか。

 対応の結果,余計なアクセスがGoogleに対して行われるようになりますが,今とところブラウジングには支障はなさそうです。不具合出ましたらお知らせ下さい。