Mのメモ

ポスドクの論文メモ。神経科学関連のツールに触れることが多め。

DNA microscopy: DNA「で」顕微する手法

DNA Microscopy: Optics-free Spatio-genetic Imaging by a Stand-Alone Chemical Reaction
Joshua A.Weinstein, Aviv Regev, and Feng Zhang
Cell, Volume 178, Issue 1, 27, Pages 229-241.e16., doi: 10.1016/j.cell.2019.05.019

【概要】
DNAが任意分子の空間分布を推定するための計測手段となりうることを示した仕事。空間局在を観察したい分子(target)について、ユビキタスに発現する分子(beacon)に対する距離情報を記録。これを、DNAバーコードによる各分子の標識と、標識物のoverlap-extension PCRによる増幅&結合によって行う。産物の配列を読めば、解析的にTarget分子の空間局在を推定可能となる。

【背景】
µmスケールで特定分子の空間局在を調べるためには光学顕微鏡を用いるのが一般的ですが、本論文では、光ではなく、DNAというモダリティでもこれが行えることを示しています。

一般に、点同士の距離関係が「全て」既知の時、点同士の距離を要素に持つ行列は、求めたい座標軸を固有ベクトルとして持つ内積の行列に変換できるんだそうです(Classical multidimensional scaling)。ただし、今回の実験系から得られるようなデータでは、近傍の点同士の距離情報しか取れず、遠い点同士の距離情報は記録できません。今回の仕事のポイントは、各分子のローカル(かつノイジー)な距離情報だけからそのグローバルな座標を推定するための解析手法、sMLE(Spectral Maximum Likelihood Estimation)*1を開発したこと(Fig. 2-3)、そして、それを実現するのに十分なSN比を持つデータを生むための分子生物学的な工夫(Overlap-extension PCR&UEIの導入)にあると思われます(Fig. 1)。

【手法と主要な結果】
Fig. 1:手法の概要説明。主に分子生物学的な工夫について。

  • ユビキタスに発現するmRNA(Beacon)と、見たい分子のmRNA(Target)を、DNAバーコードを付加したcDNAでin situ 標識(このバーコードをUMI; Unique Molecular Identifier と呼ぶ)。
  • PCRによってBeaconとTargetをin situで増幅・空間的に拡散。この時、Beaconに対するプライマーとTargetに対するプライマーに相補的な配列を持たせることにより、空間的に近接した互いの増幅産物をアニーリング時に連結できるようにする(Overlap-extension PCR)。
  • なお、プライマーにもDNAバーコードを入れておくことにより、個々の連結イベントも固有のDNAバーコード(の組み合わせ)で標識する(UEI; Unique Event Identifier)。この工夫により、アーティファクトとして生じる非特異的な連結の影響が抑制される、らしい。
  • PCR産物(beaconの配列+beaconのUMI+UEI+targetの配列+targetのUMI)の配列を読む。UEIのリード数、即ち連結イベントの頻度は、各mRNAの相対的な距離に対応するので、各mRNAの相対的な距離から、それぞれのmRNAがどの位置にあったのかを解析的に推定できる(詳細はFig. 2,3 )。つまり、光学顕微鏡を用いず、シーケンシングによって分子の空間情報を読み取ることができる。

Fig. 2:本手法の実用性検証。細胞が密な部分を用いたPreliminaryな解析。

  • GFPを発現する細胞とRFPを発現する細胞の共培養系について、ユビキタスに発現する分子(βアクチン)のmRNAをBeaconに選択。更に、RFPGFP、そして別のユビキタスに発現する分子(GADPH)をTargetとし、DNA microscopyを適用。UMIは29nt, UEIは20nt(10 nt×2)。シーケンシングのエラーは0.1%~0.3%程度で、UMIにつき平均10 種類のUEIが見られるデータになるとのこと。UEIを2種類以上持つUMIについてのみを解析に用いた。
  • 各UMIを頂点、UEIリード数を重み付きエッジとしたグラフのラプラシアン行列を作成(UEI graph laplacian)。もしこのデータセットが各UMIの二次元座標を求めるのに十分な情報を含んでいるのであれば、UEI graph laplacianの固有ベクトルで張られる三次元空間上においても各UMIの点は概ね平面に分布することが想定される、らしい。ただし、全てのUMIについて(=細胞分布が疎な部分を含めて)この解析をやったところ、UMIの分布はとても複雑な形状になった。そこで、まずは細胞が密になっているであろう部分を表すようにグラフを分割し、解析を行った。
  • 分割されたグラフについて、それぞれの固有ベクトルで張られる3次元空間に分割されたグラフに含まれたUMIの点をプロットすると、おおむね二次元上に分布した(Fig. 2E-H。少し歪んでいるが)。そして、その平面上ではUMIのクラスターが見られた(細胞っぽい感じ)。更に、GFPRFPのUMIは別々のクラスター上に集積していた。これらの特徴は、実際培養していると観察されるものに近いと考えられ、DNA microscopyによって分子の空間局在が細胞かそれ以上の解像度で観察できること(UEIに距離の情報がきちんと書き込まれていること)を示唆する。


Fig. 3:細胞分布が疎な部分も含めた上で位置を推定する方法の説明

  • 細胞が疎な部分もうまく表現するために、今後はUMIの位置が以下の2つの要素によって決まるというモデルに従って考える(Fig. 3F, より詳しい形はSupplementary Information の Equation 10)。つまり、これまでも考えていたような (1) 各UMI間のUEIのリード数によって測られる各UMI間の距離、だけではなく、(2) 全てのUEI リード数と予想される反応速度、も影響すると考える。なお、(1) はUEIを形成するUMI同士を引き付ける力で、(2) は全てのUMIを他のUMIから引き離す力と見做せる。(1)と(2)のバランスが取れるようなUMIの位置が、一番尤もらしくUEIのデータを説明すると考えられる。
  • この式を念頭に置きつつ、筆者らはsMLEと呼んでいる手法でUMI位置推定を行った。これは、UMIの2次元座標をUEI graph laplacianの固有ベクトルTop2(小さい固有値2個に対応するもの)の線型結合で表現できるものとし、(1) と (2) の差を減らすように各固有ベクトルの係数を最適化、それが終わったらもう一つ新しい固有ベクトルを導入、同様の操作を行う…といったことを繰り返す手法、らしい(用いる固有ベクトルは最大100個まで)。シミュレーションによると、sMLEはUEIの数が実験データと同じくらい少なくても(UEI/UMI=10)、疎な部分が比較的うまく表現できるのが良いとのこと(Fig. 3G)。

Fig. 4:蛍光顕微鏡による撮影結果との照合によるDNA microscopy実用性の検討。

  • GFPRFPを発現する細胞の蛍光画像とDNA microscopyによる画像の比較。sMLEを用いている。著者ら曰く、似ている、という主張(4Bと4D)。
  • 定量データが無いので、何を以て似ているとするのか不明瞭。確かにそれぞれの細胞の位置はそれっぽいっちゃそれっぽいが、捉えられていない細胞も目立つ。一番キメのデータのような気もするが…うーむ。まぁ、少なくとも、現時点では蛍光顕微鏡ほど正確ではないにせよ、DNAを用いて分子の空間情報がある程度得られるというのは確か。

Fig. 5, 6:DNA Microscopyによって細胞が疎な部分も含むような広い範囲についても細胞かそれ以上の解像度でイメージングができる

  • Fig. 5にあるように、妙なアーティファクトは乗るが、まぁ細胞っぽいクラスターは見える。
  • これらのデータから個々の細胞がGFP/RFPポジであるということを推定できるよというのをある程度定量的に示したのがFig. 6。

【感想】
著者らは今回の手法の特徴として、高価な顕微鏡など特殊な機器を必要としないこと(次世代シーケンサーが特殊な機器かどうかには議論の余地があるが)、色の問題に制限されずに様々な種類の分子を一挙に見ることができること、解像度が光学顕微鏡とは異なるに要因に制限されること、といったものを挙げています。将来的な応用として、3Dでのイメージングや、見たい分子の様々なフォーム(Somatic mutation, RNA splicing, RNA editing, etc)を一挙に見れるということについても言及していました。

また、欠点として、やはり細胞分布が疎な部分はうまく表現できないことを挙げています。この解決策として、場所が既知のDNAシーケンスをイメージングサンプル上に導入し、それをランドマークとして用いることや(Slide-seq的な?)、解析的手法をもっと改良するといったことを考えているようです。

解析の妥当性がイマイチわかりづらいのですが(実際sMLEが完璧というわけでは無いようだ)、今後ますます発展していきそうな、興味深い仕事でした。Author Contributionを見るに、この仕事はほぼ全て筆頭著者のJoshua A. Weinstein が一人でやったみたいです。彼によるこの仕事のセミナーが極めて強烈なので参考までに貼っておきます。9月からシカゴ大で独立とのこと。
https://www.youtube.com/watch?v=hrqU2RP_9rc

*1:このSpectralはスペクトルグラフ理論への言及。スペクトルグラフ理論とは、行列表現されたグラフの特徴を、そのスペクトル(一般的には隣接行列の固有値一式。今回はラプラシアン行列の固有値一式)から推定する学問、とのこと。