プリキュアデータベース構築中!

データベースとは

昨年秋から、本格的にプリキュアデータベースの構築に取り組んでいます。

ちなみに、ここでいう「データベース」とは比喩的な表現ではなく、IT業界での意味のとおりのデータベースです。

データベース – Wikipedia

今回は、そんなプリキュアデータベースについて大雑把にご紹介します。

構築済みテーブル

現在は次に示す3テーブルを構築し、『ふたりはプリキュア』から『キミとアイドルプリキュア♪』まで放送済み全話分のデータを集積しています。

  • 各作品
    • 作品種別(TV、秋映画、春映画、スピンオフ)
    • 作品の関係(続編、映画版、併映、パート)
    • タイトル
    • 略称
    • 開始日/公開日
    • 終了日
    • 総話数(TVシリーズ)
    • 総尺(映画)
    • 東映アニメーション公式URL
    • 東映アニメーションラインナップURL
    • ABCアニメーション公式URL
    • AmazonPrime配信URL
  • TVシリーズ各エピソード
    • プリキュア通算通算話数
    • シリーズ内話数
    • プリキュア通算放送回数
    • 日朝放送回数
    • タイトル
    • タイトル(かな)
    • タイトル(HTMLによる改行とルビ再現)
    • タイトル(専用ツールによる文字種解析)
    • 東映アニメーション公式あらすじURL
    • 東映アニメーションラインナップURL
    • YouTube予告URL
  • TVシリーズ各エピソード各パート
    • パート種別(アバン、Aパート、Bパート…)
    • 放送尺
    • 円盤尺
    • 配信尺
作品テーブル
TVシリーズ各エピソードテーブル
TVシリーズ各エピソード各パートテーブル

たった3テーブルだけとはいえ、すでに結構いろいろなことができるんですよ。

次に示したのは、出力可能な一例です。

  • 歴代TVシリーズ各話で放送日が前回から2週以上開いているエピソードの一覧
  • 歴代TVシリーズ各話サブタイトルの文字数ランキング(多い順)
  • 歴代TVシリーズ各話サブタイトルの文字数ランキング(少ない順)
  • 歴代TVシリーズ各話サブタイトルの文字数ランキング(漢字編)
  • 歴代TVシリーズ各話サブタイトルの漢字率ランキング
  • 歴代TVシリーズ各話サブタイトルで使用された文字ランキング
  • 歴代TVシリーズ各話サブタイトルで使用された文字ランキング(漢字編)
  • 歴代TVシリーズ各話サブタイトルで使用された文字ランキング(記号編)
  • 歴代TVシリーズ各話サブタイトルでひらがなを含まない回一覧
  • 歴代TVシリーズ各話サブタイトルで記号約物を含まない回一覧
  • 歴代TVシリーズ各話サブタイトルで日本語を含まない回一覧
  • 歴代TVシリーズ各話サブタイトルで使用された文字一覧(出現数順)
  • 歴代TVシリーズ各話サブタイトルで使用された文字一覧(コード順)
  • 歴代TVシリーズ各話サブタイトルで使用された文字情報(何話ぶり何回目、前回は何の何話)
  • 歴代TVシリーズ各話円盤収録尺一覧
  • 歴代TVシリーズ各話配信収録尺一覧
  • 歴代TVシリーズ各話本放送OA尺一覧
  • 歴代TVシリーズ各話パート歴代尺ランキング
  • 歴代TVシリーズ各話パート平均尺

従来使用していたExcelでもある程度のことは可能ですが、さすがに上記のような特殊な処理には不向きです。

プリキュア歴代TVシリーズエピソード一覧Excel

データベース使用例

プリキュアデータベースに対しては次のようにSQLクエリを発行して、結果を取得します。

歴代TVシリーズ各話サブタイトルの文字数ランキング(少ない順)取得クエリ・結果
歴代TVシリーズ各話サブタイトルの漢字率ランキング
歴代TVシリーズ各話サブタイトルで使用された文字一覧(出現数順)

ただ、クエリ発行やデータベースへのデータ追加修正を毎回手動で行うのは煩雑です。

そのため、情報の参照や変更を画面から実行できるツールを開発してみました。

TVシリーズエピソード情報エディタ画面(キミプリ#27)

この画面だけで、TVシリーズ各話ごとの情報をある程度見通せます。ルビと改行のプレビュー画面は、一応フォントをオリジナルにあわせてあります。

たとえば、この話数のアバンがキミプリで最長、歴代通算でも3位の長さであることがわかります。さらに学力偏差値と同様にμ=50,σ=10で「偏差値」も算出してみました。「91.11」という値で、歴代でも飛び抜けて長いアバンであることがわかります。

TVシリーズエピソード情報エディタ画面(キミプリ#39)

この回では、「寸」の字が『MaxHeart』10話以来約21年ぶりと、めっちゃ久しぶりに使われたことがわかります。

こういった各話ごとのちょっとしたインサイトは、この画面で直接表示できるようにしています。

このほか前述したような各種の統計も、何らかの手段で誰でも簡単に参照できるようWebでの公開を考えています。

これからやりたいこと

ひとまず作品と各エピソードの情報は整ったので、次は音楽やスタッフ・出演者の情報を集積していく予定です。音楽データベースは過去に同人誌「プリキュア音楽ハンドブック」やDJイベント「すなっくプリキュア」のために整備したものを大幅アップデートして使用します。スタッフデータベースは様々な観点から可視化できるようにデータ構造から検討しています。

🏠広島出身 中野在住 💼️職:TechPMO/エンジニア/ライター 📝プリキュア仕事:まほプリ2原画/CDBOX選曲協力/原画集編集補佐/書籍PR記事執筆 💖すき:プリキュア 劇伴音楽 フォント 語学 作画 📚勉強中:PMP® AWS ギリシャ語 ラテン語 ⛪カトリック 📦️Amazonアソシエイト参加