Data analysis guidelines for single cell RNA seq in biomedical studies and clinical applicationsをめくる

  • Data analysis guidelines for single cell RNA seq in biomedical studies and clinical applications
  • Background
  • General tasks of single-cell RNA seq data analysis
    • Experimental design
    • Raw data processing
    • QC and doublet removal
    • Expression normalization
      • 生物と技術の両方に要素がある。
      • 細胞サイズと細胞周期
      • スケーリング
    • Data integration
    • Feature selection
    • Dimensionality reduction and visualization
    • Identification of cell subpopulations
      • ある細胞がどの遺伝子をどれだけ発現しているか、という行列が得られる。
      • 正規化する。(データを整える)
      • 特徴選択
        • カットオフ値なり、カットオフ周波数なり、何かしらのフィルターを通す。
        • あるいは、分散を取って、ばらつきのあるもののみ取り出す
          • これが主成分分析絡み
        • あるいは、行列を分解していく。
      • クラスタリング
        • 細胞と細胞の距離をとる。それが行列になり、クラスタリング
        • あるいは、PCAで、PCをある程度(Elbow)で刈り取り、近傍グラフを構成したりする。
        • あるいは、分解した行列から、階層構造を利用したクラスタリング
    • Cell type annotation
      • 遺伝子の発現の仕方で
      • マーカー発現で
      • 関連データとの紐付けで
      • 教師あり学習
    • Functional enrichment analysis
    • Trajectory inference and RNA velocity
    • Cell-cell communications
      • タンパク質(受容体、リガンドのペア)のデータ
      • 遺伝子発現のデータと、細胞同士の発現状態の類似度のデータ
      • 細胞の結合のモデリング
        • 確率的な推定
        • ネットワーク手法
        • 機械学習
        • 空間情報を考慮したもの
      • 可視化と解析
    • Regulon inference and TF activity prediction
      • WGCNA
      • SCENIC
      • SCODE, SINCERITIES
      • DeepDRIM, SIGNET
    • Metabolic analysis
      • pathway based analysis
      • FBA based method
        • flux balance analysis
        • 代謝反応をある種の状態ベクトルに反応の行列を掛ける操作だと思うことにして、目的関数の最大・最小化をするような状態を決めるらしい。(あんまり見てない)
        • 詳しくはこちら