複雑系の極みである人体を機械学習で解明できるのか

複雑系の極みである人体を機械学習で解明できるのか

Image by Drum Seth

 

Bioinformatics(生命情報科学)の専門家と、先日ちょっと面白いディスカッションをする機会がありました。その専門家の主張は、こんな感じ。

 

『ゲノム解析をちゃんとやってきた立場からすると、我々が把握できている遺伝子の情報は、全体と比べるとほんの一握りで、分かっていない部分の方が圧倒的に多い。

 

そんな一握りの情報をディープラーニングに与えたところで、複雑系の極みである人体の中では、何が原因で病気を引き起こしているかは絶対に解明できない。解明に足るデータを集めるには、少なくともあと100~200年はかかる。そもそもディープラーニングは医用画像でちょこっと使えるくらいが、せいぜいだと今は考えるべき。』

 

まさに、その通りやと思います。

 

現在、ディープラーニングを含む機械学習は、バイオ分野の様々なシーンでの応用が試されているものの、壮大なブラックボックスである人体を目の前にしては、インプット(例:先天的な遺伝子、後天的な生活習慣)とアウトプット(例:病気の発症リスク、肥満の度合い)の因果関係を解明するには、全くもってしてデータが足りない状況です。

 

ここでいうデータとは、特定の疾患の原因と思われる遺伝子であったり、生活習慣と肥満の関係性を示すエビデンスだったりするわけですが、全人類のあらゆる人のパターンを説明できるほどの確固たるデータは、残念ながら我々の手元にはありません。

 

では、一介のスタートアップがテクノロジーを使って、この難しい問題に取り組むことに意味が無いかと問われれば、それはノーだと自分は考えてます。

 

例えば、SpaceX。ほんまのところのミッションは知らんけど、普通に冷静な人間が考えたら、あの会社のやってることは相当に的外れやと思うんです。だって、宇宙の規模って、どれくらいすか?

 

宇宙船の中で100万回転生を繰り返しても、まだ到達できないくらい果てしなく広い宇宙において、たかだか地球と火星の間をちょっと行き来できるようになったところで、だからなんやねんっちゅー話なわけです。

 

ビッグデータの塊である宇宙の規模から見れば、太陽系なんて一部も一部、まぁスモールデータの世界。

 

でも、そんな未知のビッグデータも、スモールデータから少しずつ解き明かすことで、自分のライフスパンでは無理でも、4~5世代先ではもうちょっと解き明かせるかもしれへん。スタートアップというのは、その時々で「分かった小さなこと」を、ビジネスを通じて産業に落とし込んでいく作業を繰り返すことで必要な資金を得ながら、人間を「分からないこと」に推し進めるエンジンのような存在やと思うんです。

 

分かっている世界だけで商売するのは、そりゃあ楽やと思います。不動産とか、金貸しとか、飲食とか、もう何世紀も変わっていないフィールドにテクノロジーを適用するのとは、ちょっと違う。この「分からないもの」に挑むスタンスこそが、スタートアップの醍醐味だとも考えてます。

 

ハカルスでは、これまでやってきた食事・運動のバイタルデータ解析に加えて、バイオ・ライフサイエンス寄りのデータ解析とAI化にこれからチャレンジしていきます。バイオ・ライフサイエンス分野でデータ解析されていた方、ぜひ下記のリンクをクリックして、1度オフィスに遊びに来てください。アナタの熱い持論に、最後まで付き合います!

ニュースレター購読Newsletter

登録はこちら