イベントレポート

投稿日：2019.04.09

シンポジウム「医療と創薬におけるシステムバイオロジー・バイオインフォマティクス・ビッグデータ」を開催（2/22）

2月22日、LINK-Jとカリフォルニア大学サンディエゴ校との共催によるシンポジウム「医療と創薬におけるシステムバイオロジー・バイオインフォマティクス・ビッグデータ」が日本橋ライフサイエンスビルディングにて開催されました。同シンポジウムには、カリフォルニア大学サンディエゴ校からトレイ・アイデカー博士とネイサン・ルイス博士が参加し、さらに日本側から理化学研究所の清田純博士、システム・バイオロジー研究機構の北野宏明博士の２名を加えた、計４名による講演が行われました。それぞれシステムバイオロジーにおける第一人者ということもあり、前半部（基本講演）ではエキサイティングな内容の講演が行われ、後半部（パネルディスカッション）では会場参加者との間で活発な質疑応答が行われました。シンポジウム終了後は、打ち解けた雰囲気の中でネットワーキングレセプションが開催されました。

［挨拶］
和賀三和子 氏：カリフォルニア大学サンディエゴ校
曽山明彦 氏：LINK-J

［講演］
トレイ・アイデカー 博士：カリフォルニア大学サンディエゴ校医学部（内科）・ジェイコブズ大学バイオエンジニアリング・コンピューターサイエンス教授
ネイサン・ルイス 博士：カリフォルニア大学サンディエゴ校医学部（小児科）・ジェイコブズ大学バイオエンジニアリング学科准教授/同CHOシステムズバイオロジーセンター共同ディレクター
清田純 博士：理化学研究所医科学イノベーションハブ推進プログラムユニットリーダー/同革新知能統合研究センター研究員/生命医科学研究センター上級研究員・スタンフォード大学客員研究員
北野宏明 博士：ソニーコンピュータサイエンス研究所代表取締役社長/ソニー株式会社執行役員・特定非営利活動法人システム・バイオロジー研究機構会長・沖縄科学技術大学院大学教授

講演①：「Decoding genomes through the hierarchical architecture of the cell」トレイ・アイデカー博士

講演のポイント

現在のディープニューラルネットワークにはブラックボックス（不可視な領域）が存在する。
腫瘍細胞における機能的ネットワークの解析を通じて「階層的な構造」を解明した。
階層構造を用いることで「ブラックボックス」部分を可視化した深層学習が可能となった。

アイデカー氏は「バイオメディカルにおける人工知能と深層学習の活用」とその課題をテーマに講演を行いました。そこでまず１点目の課題として例示したのは「ブラックボックス」問題。現在の深層学習の主流である「ディープニューラルネットワーク」は「中間層における処理過程」が可視化されていません。これに対してアイデカー氏は「バイオメディカル領域では回答だけでなく過程も理解できる必要がある」と訴えました。

２点目は「ビッグデータ」問題です。ここ数年を振り返ると、自動運転技術の登場、囲碁棋士との対戦での勝利など、人工知能と深層学習は常に世間の耳目を集めてきました。これに対してアイデカー氏は「自動車運転や囲碁などの領域と比較すると、バイオメディカル領域におけるビッグデータのサイズは大きくない」と訴えます。さらに３点目の課題として挙げるのが「複雑性」の問題。バイオメディカル領域におけるルールは「囲碁のように単純ではなく、さらに私たち自身もそのルールを正確に認識できているとはいえない状況にある」と両者の相違点を指摘しました。

そこでアイデカー氏らは深層学習のための新たなルールを考える上で、まずは腫瘍細胞について（後に精神神経疾患領域でも）ゲノム解析を実施して、腫瘍遺伝子同士の関連性の解明およびそのマッピングに挑戦しました。その結果、腫瘍細胞の発現には２種類の異なるネットワークが介在していることを突き止め、同時に「遺伝子変異から腫瘍発現に至るまでの過程」の可視化に成功しました。さらにアイデカー氏らは、この腫瘍遺伝子ネットワークの研究を通じて「このネットワークは平坦ではなく『階層的な構造』を有している」との結論に至りました。

次にアイデカー氏らは、その階層的構造をディープニューラルネットワークに活用することで「深層学習の可視化」に挑戦しました。まずは細胞の中でも極めて簡単な構造を持つ「酵母菌」でモデル化し、トレーニングデータを与えた上で「酵母菌の細胞増殖率」をシミュレーションさせてみました。その結果、シミュレーションの結果と実験結果との間に一定の相関性が認められ、かつ従来のブラックボックスモデルと遜色ない精度が確認されました。アイデカー氏はこの新たな手法を「生物学にインスパイアされた新しい深層学習」という言葉で表現します。

深層学習について、アイデカー氏は「バイオメディカル領域ではあまり有効に活用されてこなかった」と指摘します。その上で「酵母モデルを用いたネットワークの解明」などの新たな研究を足掛かりに、今後も多くの事実が解明されてほしいとの展望を述べました。また現在は腫瘍細胞に同手法を適応させる研究に取り組んでおり「次に開催されるシンポジウムではその話もできると思う」と新たな展開に自信を示しました。

講演②：「Engineering mammalian cell factories with big data and systems analysis」ネイサン・ルイス博士

講演のポイント

バイオ医薬品は医薬品市場の売上高において上位を独占している。
ビッグデータとシステムバイオロジーは「バイオ医薬品の効率的な製造」に貢献できる。
特定遺伝子のノックダウン/ノックアウトで細胞本来の分泌機能を開放できる。

ルイス氏は「ビッグデータとシステム分析による抗体産生細胞のエンジニアリング」をテーマに講演を行いました。現在の世界の医療用医薬品市場の売上高動向を見ると、上位を占める製品群の大半はバイオ医薬品であり、半数以上は哺乳類細胞（チャイニーズハムスター卵巣細胞、以下CHO細胞）を利用しています。ルイス氏によると、バイオ医薬品の課題は「細胞から製造する必要があるため高額になる」ことにあるといいます。

そこで製薬業界では、バイオリアクターの最適化などを通じて「培地１リットルあたりの抗体産生量の増加」による製造コスト減を実現してきました。しかし実際の生産では様々な制限が伴うため、現在の生産方法が経済的にも最良とは言えないといいます。そこでルイス氏は、細胞エンジニアリング技術を利用することで宿主細胞自体を改変すれば、抗体の産生量を増加させられるのではないかと考えました。

バイオ医薬品製造におけるビッグデータの活用は、医薬品企業にとっても大きな課題でした。次世代シーケンサーの登場もあってビッグデータ自体は存在していましたが、その生物学的解釈および細胞エンジニアリング技術への転用が課題でした。ルイス氏はシステムバイオロジーを活用してビッグデータを解析することで、この課題を解決できると考えました。そこでまずは現在のバイオ医薬品の主流技術であるCHO細胞に関する膨大な研究論文を検証・解析し、その結果をもとに抗体産生経路のシミュレーションモデルを構築しました。

次にルイス氏らは、この計算モデルを用いて「特定遺伝子のノックダウン/ノックアウトによる抗体産生への影響」をシミュレーション上で検討しました。その結果、「産生抗体の力価の向上」「生細胞密度の増加」「不要な抗体分泌の抑制」などが実現できることがわかりました。ルイス氏は、これらの検討結果について「細胞本来が持つ分泌キャパシティを自由な形で利用できる状況を生み出した」と考察します。「細胞内で競合する抗体成分の遺伝子を選択的にノックダウンすることで必要な抗体の生産性を上げることができれば、コスト面のメリットも大きい」。

ルイス氏はこれまでの研究について「私たちはビッグデータの解析とシステムバイオロジーを用いて「細胞内において抗体の産生に大きく影響する要素」の解明に挑戦してきた」と指摘。その上で、新しいデータとアルゴリズムを用いた「細胞エンジニアリング技術」を達成してきたと述べました。そして今後は、さらにデータを活用して「より効率的な宿主細胞の開発」が求められるだろうとの展望を示しました。

講演③：「System-level understanding of gene expression profile based on global-scale meta-analysis」清田　純博士

講演のポイント

複雑な生命現象の解明には「システムバイオロジー」が重要である。
開発した「ジーン・エクスプレッション・コモンズ」を利用すれば、全遺伝子の発現を客観的に把握できる。
システムバイオロジーによる細胞現象の解明は私たちが患者に対して負うべき責任である。

清田氏は、生命現象を解き明かす学問「システムバイオロジー」について講演を行いました。これまでの研究から、ヒトは約30億の塩基対を持ち、さらに約２万の遺伝子から約10万種類のタンパク質が日々産生されていることがわかっています。清田氏は「これほどまでに複雑な構造を私たちはどのように理解すればよいだろうか？」と疑問を呈し、システムバイオロジーがその疑問に対する回答になると考えます。

しかし清田氏が研究を開始した当時のゲノム研究は、世間には本質が理解されていないという状態でした。通常のマイクロアレイ技術による解析では、遺伝子プローブごとに感度が異なるため、2コ以上のサンプルを比較して遺伝子発現を相対的に評価することはできても、全体像の把握はできませんでした。そこで清田氏がその解決方法として着目したのが「遺伝子発現のダイナミックレンジ」でした。

まずはスタンフォード大学の計算機科学の専門家と共同で、GEO（Gene Expression Omnibu：米国立衛生研究所が管轄する遺伝子発現データベース）内に登録された遺伝子発現データを収集しました。次に収集したデータをメタ解析して「各遺伝子プローブのダイナミックレンジ」を算出し、データベースを構築しました。その結果、このデータベースに各研究者が持つマイクロアレイ・データをマッピングすることで、全遺伝子の発現像を求めることが可能になりました。今まで見えなかった「象の全体像」を客観的に知ることが可能となったのです。

さらに清田氏は「最後の１マイル」問題、すなわち完成したデータベースへのアクセス性という課題にも挑戦します。当時所属していた研究室の教授からのリクエスト、「私でも利用できるデータベースにしてほしい」を受けて、独自のオープン・プラットフォーム「Gene Expression Commons（ジーン・エクスプレッション・コモンズ）」を開発しました。使いやすい直感的なインターフェイスを採用しており、関係者からも高い評価を受けました。清田氏によると、現在では60カ国以上で5千人以上のユーザーと2千以上のプロジェクトに活用されています。

医薬品の世界では、従来の低分子化合物に代わって「細胞医薬品」というジャンルが登場しています。さらに本講演の2日前には、Ｔ細胞を用いた新しいがん免疫療法薬が厚生労働省「再生医療等製品・生物由来技術部会」で承認されるなど、次々と新しい動きが起きています。清田氏は、システムバイオロジーによる生命現象の解明は「私たちが患者に対して負うべき責任である」とその重要性を訴えました。

講演④：「AI-Driven Systems Biology」北野宏明博士

講演のポイント

現在の「科学的発見」はいまだ偶然とアクシデントと研究者の勘頼りなのが現状である。
人工知能と深層学習はシステムバイオロジーにおける新たな発見のエンジンになり得る。
いずれは「人工知能による科学的知識の発見の自動化」が達成されるだろう。

北野氏は、システムバイオロジーと人工知能の問題をテーマに講演を行いました。もともとシステムバイオロジーは、1990年代後期に北野氏が提唱した概念でした。以後20年以上にわたってシステムバイオロジー領域に従事してきた北野氏は、「私たち（人間）では日々追加される大量のデータと知識を構築することは難しい。現在は、ライフサイエンス領域だけでも年間約200万本もの論文が発表されている。これを全て読みこんで理解し、その中から重要な知識を抽出することは、もはや人間の研究者には不可能だ」と主張します。

北野氏は、早期から電子計算機によるシミュレーションモデルを自身の研究に積極的に活用していました。当時は計算速度も遅く「50万回以上のシミュレーションを実行するのに3～4か月を要する」代物でしたが、それによって特定の分子メカニズムを突き止めます。しかし北野氏によれば、同研究の中で確信をもって実行できたのはこの計算モデルの開発だけで、それ以外の「問題の定義」「仮説の生成と選択」「生物学的な解釈」などは依然として、「研究者の勘頼り」だったといいます。北野氏は「たまたま正解を選択できただけだった」と振り返ります。

こうした経験を通じて北野氏は、「人工知能を用いて新しい科学的発見のエンジンを作れないだろうか？」と考えるようになります。北野氏は、現在の「科学における新発見」はいまだ「セレンディピティ（偶然の発見）」「アクシデント（事故）」「経験にもとづく勘」の３点に依存していると指摘した上で、「現代科学における発見のプロセスはいまだ産業革命以前のレベルに留まっている」との見方を示しました。

そこでまず開発したのがオープン・プラットフォーム「GARUDA（ガルーダ）」でした。ガルーダはデータベースやソフトウェア間の互換性を確保した研究者用プラットフォームですが、同時に機械学習/深層学習が実装されており、「既存文献からのテキストマイニング」「インフルエンザウイルスの感染応答パスウェイの構築」など様々な用途に挑戦しています。さらに医療分野に対する応用としては、関節リウマチ患者を対象に「深層学習を用いた患者分類による新たな医学的知識の発見」を目指した東京大学・理研との共同研究にも取り組んでいます。

北野氏は現在「ノーベル賞受賞に匹敵する科学的発見を人工知能で実現する」プロジェクト「ノーベル・チューリング・チャレンジ」などを通じて、「人工知能の性能向上」に挑戦しています。北野氏は「現時点ではまだ「人工知能による科学的発見の自動化」は実現できていないが、その見通しは明るいだろうと考えている」と指摘。今後も興味深い研究が次々と発表されるだろうとの予測を示しました。

パネルディスカッション

４名による基礎講演の終了後は、北野氏による司会のもとで、参加者からの質問をもとにしたパネルディスカッションが実施されました。「遺伝子発現のプロファイルについては経時的変化を検討する必要もあるのではないか？」との会場からの質問に、アイデカー氏は「確かにそれは非常に重要なポイントだ」と指摘し、しかし現時点では経時的な変動を検討する有用なツールがなく、まだ「静的なデータ」しか得ることができていないと回答しました。清田氏は、その疑問に対する回答は今後2～3年以内には得られるだろうと今後の展開に期待を示しました。

ネイサン氏は、システムバイオロジーにおける現時点での課題として「ビッグデータのサイズが非常に小さく、その多様性にも課題がある」と指摘し、限られたデータをどのようにうまく活用するべきか、研究者側も熟考していく必要があるだろうと訴えました。北野氏も「データにそれほどの多様性がなく、かつノイズ（不要なデータ）が多く含まれている」との見解を述べました。さらにシステムバイオロジー自体が非常に複雑であり、多様性のないデータをいくら収集しても、そこから普遍性のある原則を発見するのは非常に難しいだろうと推察しました。

深層学習と人工知能を巡る最近の動向について、清田氏は「過剰に期待されている現在の状況を早く脱したい」と話し、「人間がこれまで獲得してきた医療における様々な道具のひとつとして理解され、利用される状況になることが理想的だと思う」との考え方を示しました。アイデカー氏も「深層学習については過大な期待が寄せられているという側面もある」との見方を示す一方で、その性能については「驚くほどパワフルであり、かつ日々向上している」と高く評価。「着実な進歩も生まれている」と訴えました。

シンポジウム終了後は、引き続き懇親会が行われました。懇親会には、登壇者も参加し、来場者からの質問や意見交換に積極的に答えるなど、盛況のうちに終了しました。

LINK-J 最新イベント情報を配信: イベントお知らせメール登録

シンポジウム「医療と創薬におけるシステムバイオロジー・バイオインフォマティクス・ビッグデータ」を開催（2/22）

講演①：「Decoding genomes through the hierarchical architecture of the cell」トレイ・アイデカー博士

講演②：「Engineering mammalian cell factories with big data and systems analysis」ネイサン・ルイス博士

講演③：「System-level understanding of gene expression profile based on global-scale meta-analysis」清田　純博士

講演④：「AI-Driven Systems Biology」北野宏明博士

パネルディスカッション

関連情報

カテゴリー

シンポジウム「医療と創薬におけるシステムバイオロジー・バイオインフォマティクス・ビッグデータ」を開催（2/22）

講演①：「Decoding genomes through the hierarchical architecture of the cell」 トレイ・アイデカー博士

講演②：「Engineering mammalian cell factories with big data and systems analysis」 ネイサン・ルイス博士

講演③：「System-level understanding of gene expression profile based on global-scale meta-analysis」 清田 純 博士

講演④：「AI-Driven Systems Biology」 北野 宏明 博士

パネルディスカッション

関連情報

カテゴリー

講演①：「Decoding genomes through the hierarchical architecture of the cell」トレイ・アイデカー博士

講演②：「Engineering mammalian cell factories with big data and systems analysis」ネイサン・ルイス博士

講演③：「System-level understanding of gene expression profile based on global-scale meta-analysis」清田　純博士

講演④：「AI-Driven Systems Biology」北野宏明博士