プリキュアデータベース構築中!
データベースとは
昨年秋から、本格的にプリキュアデータベースの構築に取り組んでいます。
ちなみに、ここでいう「データベース」とは比喩的な表現ではなく、IT業界での意味のとおりのデータベースです。
今回は、そんなプリキュアデータベースについて大雑把にご紹介します。
構築済みテーブル
現在は次に示す3テーブルを構築し、『ふたりはプリキュア』から『キミとアイドルプリキュア♪』まで放送済み全話分のデータを集積しています。
- 各作品
- 作品種別(TV、秋映画、春映画、スピンオフ)
- 作品の関係(続編、映画版、併映、パート)
- タイトル
- 略称
- 開始日/公開日
- 終了日
- 総話数(TVシリーズ)
- 総尺(映画)
- 東映アニメーション公式URL
- 東映アニメーションラインナップURL
- ABCアニメーション公式URL
- AmazonPrime配信URL
- TVシリーズ各エピソード
- プリキュア通算通算話数
- シリーズ内話数
- プリキュア通算放送回数
- 日朝放送回数
- タイトル
- タイトル(かな)
- タイトル(HTMLによる改行とルビ再現)
- タイトル(専用ツールによる文字種解析)
- 東映アニメーション公式あらすじURL
- 東映アニメーションラインナップURL
- YouTube予告URL
- TVシリーズ各エピソード各パート
- パート種別(アバン、Aパート、Bパート…)
- 放送尺
- 円盤尺
- 配信尺



たった3テーブルだけとはいえ、すでに結構いろいろなことができるんですよ。
次に示したのは、出力可能な一例です。
- 歴代TVシリーズ各話で放送日が前回から2週以上開いているエピソードの一覧
- 歴代TVシリーズ各話サブタイトルの文字数ランキング(多い順)
- 歴代TVシリーズ各話サブタイトルの文字数ランキング(少ない順)
- 歴代TVシリーズ各話サブタイトルの文字数ランキング(漢字編)
- 歴代TVシリーズ各話サブタイトルの漢字率ランキング
- 歴代TVシリーズ各話サブタイトルで使用された文字ランキング
- 歴代TVシリーズ各話サブタイトルで使用された文字ランキング(漢字編)
- 歴代TVシリーズ各話サブタイトルで使用された文字ランキング(記号編)
- 歴代TVシリーズ各話サブタイトルでひらがなを含まない回一覧
- 歴代TVシリーズ各話サブタイトルで記号約物を含まない回一覧
- 歴代TVシリーズ各話サブタイトルで日本語を含まない回一覧
- 歴代TVシリーズ各話サブタイトルで使用された文字一覧(出現数順)
- 歴代TVシリーズ各話サブタイトルで使用された文字一覧(コード順)
- 歴代TVシリーズ各話サブタイトルで使用された文字情報(何話ぶり何回目、前回は何の何話)
- 歴代TVシリーズ各話円盤収録尺一覧
- 歴代TVシリーズ各話配信収録尺一覧
- 歴代TVシリーズ各話本放送OA尺一覧
- 歴代TVシリーズ各話パート歴代尺ランキング
- 歴代TVシリーズ各話パート平均尺
従来使用していたExcelでもある程度のことは可能ですが、さすがに上記のような特殊な処理には不向きです。

データベース使用例
プリキュアデータベースに対しては次のようにSQLクエリを発行して、結果を取得します。



ただ、クエリ発行やデータベースへのデータ追加修正を毎回手動で行うのは煩雑です。
そのため、情報の参照や変更を画面から実行できるツールを開発してみました。

この画面だけで、TVシリーズ各話ごとの情報をある程度見通せます。ルビと改行のプレビュー画面は、一応フォントをオリジナルにあわせてあります。
たとえば、この話数のアバンがキミプリで最長、歴代通算でも3位の長さであることがわかります。さらに学力偏差値と同様にμ=50,σ=10で「偏差値」も算出してみました。「91.11」という値で、歴代でも飛び抜けて長いアバンであることがわかります。
Price: ¥106,700
1 used & new available from ¥106,700

この回では、「寸」の字が『MaxHeart』10話以来約21年ぶりと、めっちゃ久しぶりに使われたことがわかります。
こういった各話ごとのちょっとしたインサイトは、この画面で直接表示できるようにしています。
このほか前述したような各種の統計も、何らかの手段で誰でも簡単に参照できるようWebでの公開を考えています。
これからやりたいこと
ひとまず作品と各エピソードの情報は整ったので、次は音楽やスタッフ・出演者の情報を集積していく予定です。音楽データベースは過去に同人誌「プリキュア音楽ハンドブック」やDJイベント「すなっくプリキュア」のために整備したものを大幅アップデートして使用します。スタッフデータベースは様々な観点から可視化できるようにデータ構造から検討しています。



