JSTトッププレス一覧 > 共同発表

平成29年2月21日

株式会社シンクパワー
産業技術総合研究所
科学技術振興機構(JST)

歌詞のトピックに基づいてさまざまな歌詞に出会える新しい歌詞探索ツール「Lyric Jumper」を公開

~(株)シンクパワー「プチリリ」の大規模歌詞データを産総研の技術で自動解析して実現~

ポイント

株式会社シンクパワー【代表取締役社長 冨田 雅和】(以下「シンクパワー」という)と、国立研究開発法人 産業技術総合研究所【理事長 中鉢 良治】(以下「産総研」という)情報技術研究部門【研究部門長 田中 良夫】後藤 真孝 首席研究員、メディアインタラクション研究グループ佃 洸摂 研究員、石田 啓介 テクニカルスタッフらは共同で、歌詞のトピックを可視化して、膨大な曲の歌詞の中から興味のある歌詞を見つけることができる歌詞探索ツール「Lyric Jumper(リリック ジャンパー)」(https://lyric-jumper.petitlyrics.com/)を開発した。シンクパワーが運営する歌詞配信サービス「プチリリ」(http://petitlyrics.com/)内で、無料で利用できるツールとして、2017年2月21日に一般に公開する。

「Lyric Jumper」は、「プチリリ」が配信する歌詞データの一部(開始時は約15万曲)を、産総研が開発した歌詞トピック解析技術を用いて自動解析し、歌詞に出てくる単語の出現の仕方から、楽曲ごとのトピックを自動推定することで実現した歌詞探索ツールである。自動推定された各トピックには、単語の出現傾向から、「大人の恋愛(男性編)」「大人の恋愛(女性編)」「夢と未来」「硬派」「センチメンタル」といった名称がラベル付けされており、利用者はトピックを手掛かりにさまざまな探索を行える。

アーティストによって歌詞のトピックの傾向には違いがあり、また同じアーティストでも楽曲によって異なるトピックがラベル付けされる。「Lyric Jumper」は、こうした傾向や違いを可視化して、利用者がトピックに基づいて新たなアーティストや歌詞を次々と探索できるユーザインタフェースをウェブ上で提供する。これにより、従来の単純な曲名選択や歌詞フレーズ検索では不可能だった、下記の5つの機能のような新たな切り口による歌詞との出会いや発見を実現できた。利用者は、パソコンかスマートフォンのウェブブラウザで「Lyric Jumper」にアクセスして無料で利用できる。それぞれの図の左側がパソコンでの画面表示例、右側がスマートフォンでの画面表示例を示し、図の下の説明ではパソコン上での操作を紹介する。

本研究は、科学技術振興機構(JST) 戦略的創造研究推進事業 ACCELの研究開発課題「次世代メディアコンテンツ生態系技術の基盤構築と応用展開(研究代表者:後藤 真孝(産総研 情報技術研究部門 首席研究員)、プログラムマネージャー:伊藤 博之(JST))」の一環として、産総研が技術開発した。

<研究の内容>

「Lyric Jumper」は、従来は困難だったトピックに基づく多様で柔軟な歌詞探索を実現し、下記の3つの利点が得られた。

<プチリリについて>

「プチリリ®」は、シンクパワーが運営する歌詞配信サービスであり、シンクパワーの登録商標である。再生音楽にあわせてカラオケのように流れる同期歌詞を含めた、約240万曲もの歌詞データを提供している。「Lyric Jumper」は、プチリリが2016年12月末の時点で配信していた日本語歌詞の歌詞データの一部(約15万曲)を利用できるが、今後、利用できる歌詞データを増やしていく。プチリリでは、「Lyric Jumper」の利用レポートも公開中である。

<歌詞トピック解析技術について>

産総研が研究開発した歌詞トピック解析技術は、大規模な歌詞データを与えるだけで、アーティスト、歌詞、単語という3階層の構造を考慮しながら、歌詞でのさまざまな単語の出現の仕方からトピックを解析して、事前に決めた個数のトピック群を自動的に推定できる。トピック数は解析時に自由に設定でき、「Lyric Jumper」では20個に設定した。各トピックは、歌詞に使われる単語の偏りを表す確率分布として定義される。そして、与えられた歌詞データ全体の傾向を考慮しながらその傾向の差異が端的に表現されるようにトピック群が自動決定された後に、その中の1つのトピックを各歌詞データに割り当てる。この技術による解析結果を「Lyric Jumper」で用いる際には、トピックの名称を手動でラベル付けして簡潔に表示しており、たとえば、「私」「あなた」「涙」「約束」という単語の出現確率が高いトピックに対しては「大人の恋愛(女性編)」という名称を、「夢」「明日」「未来」「笑顔」という単語の出現確率が高いトピックに対しては「夢と未来」という名称を表示している。

<今後の展開>

シンクパワーと産総研は、今後も引き続き両者で共同開発を進め、「Lyric Jumper」の機能を向上させるとともに、シンクパワーが保有する大規模な歌詞データを活用して研究開発を進めている「歌詞のレコメンドエンジン」の実用化に取り組んでいく予定である。

<参考図>

図1 アーティストごとに歌詞のトピックの傾向を可視化する機能

中央のアーティスト名を囲む円周上の比率が、そのアーティストの持ち歌におけるトピックの比率を表している。右上には、そのトピックの名称とトピックごとの代表的な単語群が表示されている。

図2 トピック別アーティストのリストアップ機能

左側からトピックを選ぶとその右にアーティスト名一覧が表示されて選択できる。

図3 歌詞のトピックによる絞り込み機能

中央のアーティスト名を囲む円周上に表示されたトピックを1つ選ぶと、右側の曲名一覧がそのトピックに分類された曲だけに絞り込まれ、曲名の選択がしやすくなる。

図4 トピックと関連が深いフレーズがすぐわかる歌詞表示機能

曲名を選択するとその歌詞が表示される。歌詞のトピックと関連が深いフレーズがそのトピックに対応する色に着色されて大きく表示される。

図5 フレーズ発掘ボタン機能

アーティスト名の画面で「フレーズ」や「PUSH!」と表示されたフレーズ発掘ボタンを繰り返し押すと、そのアーティストの代表的なトピックに関連づけられる歌詞の1行が次々と現れる。利用者は興味を持った歌詞が出たら、その歌詞全体を見て楽しめる。

<お問い合わせ先>

<JST事業に関すること>

科学技術振興機構 戦略研究推進部
寺下 大地(テラシタ ダイチ)
〒102-0076 東京都千代田区五番町7 K’s五番町
Tel:03-6380-9130 Fax:03-3222-2066
E-mail:

<報道担当>

株式会社シンクパワー
菊地 俊哉(キクチ トシヤ)
〒101-0063 東京都千代田区神田淡路町1-4-1 友泉淡路町ビル5F
Tel:03-5289-7212
E-mail:

産業技術総合研究所 企画本部 報道室
〒305-8560 茨城県つくば市梅園1-1-1 中央第1つくば本部・情報技術共同研究棟8F
Tel:029-862-6216 Fax:029-862-6212
E-mail:

科学技術振興機構 広報課
〒102-8666 東京都千代田区四番町5番地3
Tel:03-5214-8404 Fax:03-5214-8432
E-mail: