サイトアイコン 高性能計算研究室

卒研メモ: openBDの出版日書式

 前回に続き,4月までにopenBDで新刊情報を取り出せないかと,イロイロ遊び始めました。ということで飽きないうちはこちらに気が付いた点をチマチマ書いていくことにします。

 新刊をチェックするためには出版日を取り出す必要があります。ということでsummaryのpubdateをざっと眺めてみました。昨日現在で約79万件のISBNコードからsummaryが取り出せましたが,たまに全くsummaryがないものもあるようです。

 ということでpubdateの書式ってどうなっているのかなと眺めてみると,これが千差万別,中には「25 cm-01」という明らかに間違っているだろというものもあり,書誌データのフリーダムさを楽しんでおります。

 書式を類別すると

あたりで大体尽くされている感があります。cや[]が付くのは何でかしら?

 イレギュラーなものとしては,コピペすると

ですね。和暦は昭和が大多数で,平成は1件のみでした。この辺はチマチマ例外処理するか無視するしかないかな?

 あと,ちゃんと2017年1月の書誌データも追記されているのが分かったのが良かったです。新着情報取り出しも継続していけるかしらん?

 

モバイルバージョンを終了