高解像度空間プロテオミクスを使用したアフリカのトリパノソーマの多様性のマッピング
Jul 01, 2023
Nature Communications volume 14、記事番号: 4401 (2023) この記事を引用
2065 アクセス
26 オルトメトリック
メトリクスの詳細
アフリカトリパノソーマは、サハラ以南のアフリカに重大なヒトおよび獣医学的疾病負担を課す、多種多様な真核生物の寄生虫です。 種と生活環の段階間の多様性は、このグループ内の異なる宿主および組織の指向性を伴います。 ここでは、アフリカの 2 つのトリパノソーマ種、ブルーセイ トリパノソーマとコンゴレン トリパノソーマの空間プロテオームが、2 つのライフ ステージにわたってマッピングされています。 得られた 4 つのデータセットは、細胞タイプごとに約 5500 個のタンパク質の発現の証拠を提供します。 細胞タイプごとに 2500 以上のタンパク質が特定の細胞内コンパートメントに分類され、4 つの包括的な空間プロテオームが提供されます。 比較分析により、さまざまな生物学的ニッチへの寄生虫の適応の重要な経路が明らかになり、これらの病原体種内および病原体種間の多様性の分子基盤についての洞察が得られます。
キネトプラスチドは単細胞の鞭毛を持つ真核生物で、人間、家畜、作物植物種の重要な寄生虫が含まれており、通常は無脊椎動物によって伝染されます。 このクラスにはアフリカトリパノソーマが含まれており、これらは集合的にさまざまな哺乳類に感染し、ヒトおよび動物のアフリカトリパノソーマ症を引き起こします。 アフリカのトリパノソーマを特徴づける研究の大部分は、ブルーセイトリパノソーマを用いて行われています。 一つには、2 つの亜種がヒトに感染性を持っていること、また、この種の体外培養と遺伝子操作が比較的容易であることが挙げられます。 T. ブルーセイは寄生虫としてだけでなく、よく保存された興味深い真核生物の生物学的特徴と非標準的な真核生物の生物学的特徴の両方を備えた多様なモデル生物としても研究されています。 近縁種であるコンゴトリパノソーマおよび三日月トリパノソーマは、牛トリパノソーマ症の主な原因物質です。 獣医学的に重要であるにもかかわらず、これらの種に関する研究はかなり少ない1。 アフリカのさまざまなトリパノソーマ種は、異なる細胞特性と感染特性を持っていますが、その多くの分子基盤は不明です2、3、4、5。
アフリカのトリパノソーマは、そのライフサイクル中にさまざまな外部環境にさらされており、寄生虫は、現在の環境での成長と生存に適応した、または次の環境に事前適応した一連のライフステージを区別します6。 各生活段階は、単一の鞭毛と単一および複数コピーの細胞小器官の集合を備えた、共通の高度に組織化された極性コア細胞構造に基づいています。 オルガネラの相対的なサイズ、位置、タンパク質含有量は、ライフステージごとに異なります。 すべての真核細胞と同様に、トリパノソーマにおけるタンパク質の細胞内局在は、そのタンパク質の生化学的環境を定義するだけでなく、分子相互作用の可能性も定義します。 したがって、タンパク質の機能はタンパク質の局在化と密接に関連しています。
細胞内のタンパク質の局在を決定するには、顕微鏡法とプロテオミクスという 2 つの主なアプローチがあります。 顕微鏡検査により、特定の局在化を正確に解決できます。 サンプル内の細胞間の変動を検出できます。 複数の部位に局在するタンパク質を容易に識別できますが、タグ付けや不適切な発現によるアーチファクトが発生する可能性があります。 タンパク質特異的な抗体を取得したり、目的のタンパク質を遺伝子操作したりする必要があるため、顕微鏡検査は通常、研究ごとに少数のタンパク質に限定されます。 プロテオーム全体の顕微鏡解析は貴重で豊富なデータセットですが、簡単ではなく時間のかかる取り組みであり、これまでのところ、Saccharomyces cerevisiae 7、Humans 8、T. brucei 9 などの少数の種に限定されています。
空間プロテオミクスは、オルガネラの単離または濃縮とそれに続く質量分析 (MS) に基づいており、通常は遺伝子組み換えを必要とせずに、特定の細胞内位置に濃縮されたタンパク質の同定を可能にします。 これらの方法は、ミトコンドリア、グリコソーム、鞭毛、核などのトリパノソマチド内の細胞小器官または構造に存在するタンパク質を明らかにするのに非常に効果的です10、11、12、13、14。 ハイスループット MS ベースの手法を使用して、複数の条件、状態、または細胞型について 1 回の実験で数千のタンパク質の位置を系統的に特定できるようになりました 15、16、17、18、19、20、21、22。 このような方法には、hyperLOPIT (同位体タグ付けによるオルガネラタンパク質のハイパープレックス局在化) 16,23 が含まれます。 これは定量的プロテオミクスアプローチであり、機械学習アルゴリズムの適用によって可能になる個々の細胞小器官の単離を必要とせずに、プロテオームの空間マップを解析することができます24、25、26、27。 HyperLOPIT および関連する LOPIT 手法は、哺乳類、昆虫、酵母、植物、原生動物の細胞型の空間マップを生成するために利用されています 16、21、28、29、30、31、32。
0.85 for all pairwise comparisons), demonstrating the reproducibility between experimental iterations (Supplementary Fig. 7 and Supplementary Data 8)47. Next, to define the spatial proteomes for each cell-type, final classifications were generated by performing TAGM-MAP analysis on each combined 33-plex dataset (Fig. 1A and Supplementary Data 9). Using this approach, 2679 and 2795 proteins were classified in T. brucei BSF and PCF respectively (Fig. 3A, B and Supplementary Data 9). In T. congolense, 2507 and 2504 proteins were classified in the BSF and PCF respectively (Fig. 3A, B and Supplementary Data 9). These four spatial proteomes provide a comprehensive localisation dataset for two closely related species, across two life-stages each, which has not been achieved on this scale before in any parasitic organism./p> 1e3; Average Reporter S/N > = 5; Isolation Interference <= 50%32. PSMs matching to contaminants (cRAP and cRFP) and those with missing values in any of the 11-plex TMT quantitation channels were removed. PSM intensities were sum-normalised then median-aggregated to the protein level. Each 11-plex TMT experiment was then concatenated to form a 33-plex dataset and proteins with missing values in any of the experiments were removed35./p>0.999 and separately an outlier probability <5 E-5. Proteins that did not meet the thresholding criteria were designated as ‘unknown’. To assess the reproducibility of classifications produced by individual experimental iterations, TAGM-MAP was also performed with the default settings on each 11-plex dataset separately. Classifications were retained if they exceeded a localisation probability >0.99. To assess the variability in classification between the experiments, datasets were compared pairwise using the adjusted Rand index which assigns a score of 0 if consistency is what is expected at random and 1 for perfect consistency using the R package mmclust (v1.0.1)47. To avoid inflating or deflating the ARI due to an excess of “unknown” allocations these were filtered before comparison. Analysis using TAGM-MCMC was then used to provide insight into proteins that were unknown according to TAGM-MAP where it could be due to dynamic protein localisation. This model was implemented using Markov-chain Monte-Carlo. The collapsed Gibbs sampler was run in parallel for 9 chains (T. brucei) and 4 chains (T. congolense) with each chain run for 10,000 iterations. Convergence was assessed using the Gelman-Rubin’s diagnostic and all Markov chains were retained for T. congolense; whilst for T. brucei the best two chains were retained. No thresholding criteria was applied with protein allocations and compartment joint probabilities are reported. Joint probabilities were used to evaluate proteins that may exhibit localisation to more than one compartment./p>=2X the number of genes versus the counterpart in T. brucei or T. congolense accordingly. Cases of two-one gene count orthogroups in T. brucei-T. congolense where two fasta header identifiers matched to a single gene identifier were removed from this set in T. brucei./p>