公益財団法人日本デザイン振興会 公益財団法人日本デザイン振興会

テーマ企業インタビュー:クリムゾンテクノロジー株式会社

2021年度東京ビジネスデザインアワード

「東京ビジネスデザインアワード」は、東京都内のものづくり中小企業と優れた課題解決力・提案力を併せ持つデザイナーとが協働することを目的とした、企業参加型のデザイン・事業提案コンペティションです。

企業の持つ「技術」や「素材」をテーマとして発表、そのテーマに対する企画から販売までの事業全体のデザイン提案を募ります。2021年度は、テーマ12件の発表をおこない、11月3日(水・祝)までデザイン提案を募集中です。本年度テーマに選ばれた12社へのインタビューをおこない、技術についてや本アワードに期待することなどをお聞きしました。


お話:代表取締役 飛河和生氏 AIエンターテイメント事業部 企画営業部 波多江良徳氏 

■リアルタイム声質変換を可能にするAI技術の開発

長年声質変換に取り組んできたクリムゾンテクノロジーがテーマとしたのは、さまざまな声を学習したAIがリアルタイムに人の声を最適にマッチングした声に変えるAI声質変換技術。声質変換という馴染みのない分野ではあるが、実はエンターテインメントの分野では今後の利用に大きな期待が寄せられている技術である。音声コミュニケーションの付加価値を提案するこの技術の新しい使い方の提案が求められている。

AIがもたらすエンターテイメント体験

—2002年創業ですが、創業の経緯を教えてください。

もともと電気メーカーの研究所のメンバー4名で技術開発をメインに立ち上げた会社です。エンジニアが中心の会社ですが、可能な限りアーティスト支援の立場にたってテクノロジーを開発することを目指して立ち上げました。それが今AIエンターテインメントとして事業展開しているサービスになります。

長年、音にまつわるサービスを開発されてこられたそうですが、これまでどのようなものを作ってきましたか?

最初は受託開発ということで楽器やカラオケ、音による空間制御、リバーブなどのソフトウエアといった音にまつわるツールを開発し提供してきました。2年目から新たな事業の柱として音楽配信の事業を始めました。

音楽配信は現在では当たり前になりましたが18年前には一般的ではありませんでしたよね。

はい。当時はまだまだ配信はアーティストさんにとってはCDが売れなくなるから困ると言われていたような時代でした。具体的にはアーティストさんから曲をお預かりし、楽曲をいろいろな音楽配信サービスをする会社さんに提供するアグリゲーションというサービスになります。理解のあるところから少しずつ契約をしていくというところからはじめていきました。現在では弊社で40万曲ほどの契約があります。

先ほど設立当初の思いとしてアーティスト目線に立ったサービスというお話がありましたが、そこにはどのような思いがあったのでしょうか?

当時はガラケーの着信メロディの時代でしたが、いずれは音楽を直接ユーザーに届ける時代が来るだろうと確信していました。音楽そのものを配信するということに加えて、アーティストさんが考えていることや個性を活かせる技術や表現方法を模索したいと思っていました。あとでお話をしますがアーティストさんへの利益配分についても当初から留意しています。10年ほど前にAIの技術が出てきた当時から社会科学的な部分とは別に、このAIを音楽やエンターテインメントの領域に使っていく研究を始めました。

御社のAIを使った音声サービスにはどのようなものがありますか?

現在2つありまして、ひとつは「リアチェンvoice」というものになります。これは今回のテーマにもさせていただいているのですが、AIによる声質のリアルタイム変換技術です。もうひとつが「brAInMelody(ブレインメロディ)」というもので、これは人の脳波や心拍といった生体データを計測しながら音楽を聴きどんなことを感じているかということをAIが推測して、その人に一番最適な音楽を作成するというシステムです。現在これらをAIエンターテインメントビジネスとして本格的に事業化しようとしているところです。

より使いやすいデザインへ 

今回の応募テーマである「AI声質変換技術」ついて教えてください。

これは先ほどお話しした「リアチェンvoice」というものになります。まずAIによる声質学習システムがアプリケーションに設定されたキャラクターの音質とユーザー双方の声の抽出をおこないます。その音声を機械学習をすることで、そこで構築されたボイスモデルをもとにユーザー(ナレーターボイス)の声質を設定されたキャラクター(ターゲットボイス)にリアルタイムで変換するというものです。ほとんどタイムラグもなく男性の声を可愛らしい女性の声やイケメン風のボイスに変換したり、初期設定のボイスに加え、有料で多彩なターゲットボイスの追加をすることも可能です。こちらは一般向けの「Voidol」のPC版とiOSのアプリ版とがあり、さらにユーザーとキャラクター双方の声を収録・学習し、高い精度で変換できるプロ版があります。ほかには一般販売はしていませんが、企業さまから発注を受けて制作したボイスもあります。

より機能を特化したプロ版もあるのですね。

プロ版はイベントやコンテンツ制作、プロダクションなどで第三者の声を出したいというニーズに対して開発しています。企業さん向けにはSDK(ソフトウェア開発キット)というエンジンだけをプログラムの形で提供して、例えばお客様のシステムに我々のボイスチェンジソフトウエアをを埋め込んでいただくという形での提供も行っています。

プロ版は現状どのようなシーンで使われているのでしょうか?

もともとはテーマパークでのショーなどで使われることを想定して開発しました。現場のナレーターさんがプロの声優さんの声でキャラクターになりきってお客様にサービスをするというものです。テーマパークでのキャラクターの声を使った接客やステージの演出、遠隔接客では印象のよい声質に変換したりさまざまなシーンで活用されています。一般向けに関しては自分の声ではなくアバターとともに匿名性をもって楽しみたいというVtuberさんなどにもご使用いただいており、B to B、B to Cに活用されています。今年の8月31日にはアーティストの声質に近づけながらカラオケが歌える「mimivo」がiPhone版としてリリースされたばかりです。歌唱されているアーティストさんにも声質の使用料金が還元できるような仕組みづくりを目指しています。

「Voidol」では既に声優さんに利益が還元される仕組みになっており、こちらでも同様の利益配分システムを考えています。

音声が創造性やクリエイティブにも繋がっているという考え方に共感します。声優さんなどアーティストの立場に立ってメディアをつくられているのですね。そういった意味では既にわたしたちが耳にしている技術なんですね。

はい。最近のクイズ系テレビ番組での使用例もありますので、すでに耳にされているかもしれません。

今回のアワードへの応募動機を教えてください。

弊社はエンジニアが立ち上げた会社になります。出来上がった技術をいろいろなところに使っていただきながら、そこで反応としていただいた声を次の製品開発に反映させて、またその次へという流れで開発してきました。風潮としてどうしても技術やニーズ中心なところがあります。社内にはデザイナーがいませんので企画面の発想が弱く、長年いつかはデザイナーさんとやってみたいという思いがありました。

このようなアプリケーションの場合、使いやすさと同時に感情移入という部分も重要になってくるように思います。そうなると例えば、入口の部分でユーザーインターフェースデザインも重要になってきますよね。

そうなんです。それとキャラクターの声に変換するという以外に、今後ピッチやフォルマントを自然で高品質に声質変換をする新技術も展開する予定です。商品を技術屋が製品化するとどうしてもマニアックなものになりがちでして……。企画段階からデザイナーさんに入っていただき、このふたつをやさしく、しかもスマートでかっこいいデザインに落とし込んでいきたいというのも今回デザイナーさんと一緒にやってみたい理由です。

必要とされているのはまさにコミュニケーションの部分のデザインですね。これまではどのようにつくられてきたのでしょうか?

ユーザーインターフェースに関しては社外のデザイナーさんに企画内容をお伝えし、制作していただくことがほとんどです。これまで当社ではデザイナーさんに企画段階から入っていただくという経験がありません。今回すごくいい機会だと思いますので、デザインに加えて、使い方や伝え方、コミュニケーションの部分でもぜひエンジニア視点ではないところで意見やアイデアをいただければと思い応募させていただきました。

あらたな使い方としてどのようなニーズを想定されていますか?

コロナ禍もあってテレワークなどでオンライン会議も多くなってきつつありますが、テレコミュニケーションの新しいツールとしてもご活用いただけないかと思っています。ですが、ソフトウエアを開発することは出来ても、使い心地など幅広い使い方という部分でのアイデアがどうしてもスマートではないという課題があります。

デザインの力で愛される使い心地を

今回の東京ビジネスデザインアワードではデザイナーとどのようなことをやってみたいですか?

一般向けの部分でデザイナーさんのお知恵をお借りしたいと思っています。プロ向けに関してはニーズがはっきりしていることもあって、使い方に合わせた技術を提供することはできています。一方、一般の方に対しては実際に体験していただければ面白さは伝わるのですが、コンセプトに関してはまだ少し弱いと感じているところもあります。より敷居を低くして、このアプリでできることが分かるデザイン、楽しみに繋がる使い方や伝え方の部分でのアドバイスもいただければと期待しています。

ソフトやアプリを直感的に使いこなす入口としてのデザインですね。

はい。あと、音に関することが好きなデザイナーさんと出会えたら嬉しいです。

弊社の製品は音や音楽、楽器などのエンターテインメント寄りのものになっているのですが、たとえば次の技術として、年齢を重ねることで聞き取りにくくなってしまった声を聞き取りやすくしたり、なんらかの事情で自分の声に違和感をもっている方に対して、ボイスチェンジをすることで少しでも普段の生活を生きやすくしていただく技術の開発も将来的には目指していきたいと思っています。そういった意味ではAIが学習するだけの音声データ量さえあれば、亡くなった方の声をリアルに再現することも可能です。実はこの技術は声帯を手術された患者さんに対して名古屋大学の戸田智基教授が開発された技術の一部を使ってエンターテインメントとして使わせていただいているものです。

そういった方面からのアイデアもございましたら、最初は実験からにはなってしまうかもしれませんが企画するところからデザイナーさんとご一緒させていただけたら嬉しいです。

先ほど亡くなった方の声を再現というお話もありましたが、電子的なものではありますが「愛着」をいかに育むかということもキーワードのひとつになりそうですね。

確かに愛着という観点は大切かもしれませんね。弊社のソフトはエンジニア目線が強く現状ではどうしてもIT機器というどこかすました顔をしているところがあります。だから人間と対峙したときの愛嬌や親しみやすさはまだまだ足りていないと思っています。ぜひ社会の役に立てる愛される製品づくりをご一緒させていただければと思います。

クリムゾンテクノロジー株式会社(世田谷区) https://crimsontech.jp

テーマ:ユーザーの声をリアルタイム変換する「AI声質変換技術」

2002年2月創業。創業当時は携帯電話の着信メロディが主流の時期で、自社保有の音に関する技術や人脈を活かし、新たな音楽市場をネットワーク上で実現することを当初の目標に掲げる。その後、通信カラオケ、着信メロディといったMIDIの技術を用いた市場から、さらに現在の音楽配信市場へと、音楽を身近に届けることが可能となった。「技術革新で人々の創造性を支援します」をスローガンに、技術で音楽制作者やアーティストなどの創造性やビジネスを拡大。社員は20代前半から50代まで幅広く在籍し、技術ベースの会社らしく取締役や代表にも事業についての意見を言うことができる社風である。大学シーズの社会実装を目論み、大阪大学ベンチャーキャピタルや日本ベンチャーキャピタル等からの出資を受けビジネスを拡大中。AIを利用したエンターテインメント利用の世界での活躍を目指す。

インタビュー・写真:加藤孝司


2021年度東京ビジネスデザインアワード
デザイン提案募集期間 113(水・祝)まで 

応募資格:国内在住のデザイナー、プロデューサー、プランナーなど
応募費用:無料
詳細は公式ウェブサイトをご覧ください

https://www.tokyo-design.ne.jp/designer/  

BACK TO TOP

NEWS LETTER

JDPより最新のデザインニュースをお届けします。
ご登録は無料です。お気軽にご利用ください!

  • GOOD DESIGN AWARD
  • GOOD DESIGN Marunouchi
  • GOOD DESIGN STORE
  • DESIGN HUB
  • 東京ビジネスデザインアワード
  • TOKYO DESIGN 2020
  • SANSUIGO