Lab. Clin. Pract., 19(1) : 46-51 (2001)New Technology
SNP
筑波大学臨床医学系臨床病理
川 上 康
は じ め に
欧米主要先進国および日本において,ゲノム解析プロジェクトが1990年初頭より国際協調のもとに進められた.このプロジェクトは,ゲノムがもつ巨大な情報量(ヒトでは細胞あたり約30億塩基対がゲノム情報として存在する)である塩基配列を明らかにすることである.解析は当初,予想された速度を上回り,すでに20種類の微生物,1種類の動物のゲノム配列が決定されている.ヒトゲノムに関しても配列決定は当初よりも飛躍的に早まり,遅くとも2003年には約30億塩基対の全塩基配列が決定され,今後この中に含まれる遺伝子の同定と機能解析が世界中の研究室で急速に進むことが予想される.
ゲノムの塩基配列解析が終了するというニュースを聞くと,何か標準的な塩基配列があるかのように誤解をうけやすいが,人間に一人一人個性があるように,各人の遺伝子は異なる.ただし全体の 99.9% は共通の配列で,個人差は 0.1% とされており,この差によって個人の個性が決まる一方,特定の疾患に罹患しやすい感受性,薬物や環境因子に対する反応性が個人毎に決定されている(注:任意の二人のDNAを比較した際に共通な部分が 99.9% という意味でありすべての人間において 99.9% が共通というわけではない.また,単純な相同性比較にそぐわない大きな欠失や挿入,リピートは除いての数字である.)
本稿で取り上げるSNPは,0.1% ある遺伝子の個人差といわれるバリエーションを構成する何種類かの遺伝子変異のうちの一つである.SNPは従来最も利用されてきたマイクロサテライトに代わって,大規模な遺伝子スクリーニングを行うのに適した多型マーカーとして脚光を浴びており,遺伝子検査の分野でも重要視されている.
1. 遺伝子多型とSNP
遺伝子の個人差としての変異が集団の 1% 以上になるものを遺伝子多型(polymorphism)と呼ぶ.つまりランダムに10,000人について,ある遺伝子領域を解析して,100人以上で特定部位の塩基に違いがあれば,それが遺伝子多型となる.一方,1% 未満のものは,レアバリアント (rare variant) と呼ぶ.
SNPはSingle Nucleotide Polymorphism(一塩基変異多型)の各頭文字をとったものであり,1% 以上の頻度で出現する塩基配列上の単一塩基の置換,挿入,あるいは欠失による遺伝子多型をいう.SNPs(スニップス)という使い方もあるが概念を表す意味あいではSNPという言葉を用いる.
人類はアフリカ大陸に起源があり,世界中に拡散したと考えられ,その過程で遺伝子突然変異(通常親から子への1継代で数十個の変異が出現する)が生じ,人種が形成されていったとされる.したがって,日本人とヨーロッパ人とでは顔かたちが異なる特徴をもつように遺伝子多型も異なる.このため,対象となる集団がヨーロッパのある国にすむ人種か,日本人かでSNIPは微妙に異なる.
遺伝子変異が直接生存に必要な身体能力の低下や重篤な疾患をひき起こす場合,個体は淘汰されて変異は継代されない.一方,遺伝子変異が直接的な引き金にならないと淘汰されず継代されるが,変異が近傍で蓄積されたり,環境が変化した場合には発症に関与してくる.生活習慣病などはその例であり,近年食生活が豊富となりエネルギー蓄積が過剰となった環境では,従来は生命維持に必要なエネルギー蓄積を起こしやすい遺伝子多型が逆に,生活習慣病を起こしやすい遺伝子多型へと変化することになる.したがって,遺伝子変異が強く疾患の発症に影響する場合,変異と言い,1個の変異では発症に明らかな影響を及ぼさないもの,あるいは全く影響のないものを多型とする考え方もある.遺伝子多型には,SNPのほかにもマイクロサテライト,塩基欠損,塩基挿入,繰り返し配列の回数の違い,制限酵素断片多型(RFLP)などさまざまな種類がある.
2. SNPと疾患原因遺伝子の同定
従来よく行われてきた,マイクロサテライトの多型を利用する方法に連鎖解析法がある.疾患原因遺伝子とマイクロサテライトマーカーが連鎖し,メンデル型遺伝形式により次世代に伝わるかにより,疾患原因遺伝子とマーカーとの組み換え距離を推定し,ゲノム上で疾患遺伝子の存在する領域を絞り込んでいくものである.一方,多遺伝子性疾患の遺伝形式は,対象となる遺伝子が複数存在するために,単一遺伝子性疾患に用いた方法で疾患感受性遺伝子を同定することは難しいので,通常はノンパラメトリックな解析方法を用いる.代表的なものが亜罹患同胞対解析法 (affected sub-pair method) であり,同胞(同じ親をもつ兄妹)がある疾患に罹患している場合,罹患した兄妹は親から共通した疾患感受性遺伝子を受け継ぐ確率が高くなることを利用し,罹患同胞間で,あるゲノムマーカーの多型を共有する一致率を検定し,疾患感受性遺伝子と連鎖するマーカーを見いだし,候補領域を数Mbから数十Mbに絞り込む.しかし,これらの解析法では領域は数Mbまで絞り込むのがやっとであった.
SNIPはゲノム上に300〜500塩基対に一つ存在し,数が多いとされるマイクロサテライト(数万個)と比較しても約300万個と圧倒的に多く,しかも全ゲノムを通してほぼ均一に分布するため原因遺伝子の絞り込みに適したマーカーといえる.高密度に存在するSNPを用いた解析では血縁に関係なく大規模な相関解析 (population-based wholegenome association study) を行うことが可能であり,候補遺伝子の存在領域を30Kb程度まで絞り込むことが可能である.ただし,SNPは従来の遺伝子マーカーと比較してすべての面で有利ではなく,ある部位での多型が最大4つまでしか存在しないため,ポジショナルクローニングを行ううえでは扱いにくい.このため,実際はマイクロサテライトを利用して,おおまかに領域を絞り込み,その部分に存在するSNPを利用してさらなる絞り込みを行うことが多い.
ゲノムの解析作業によって,多くの未知遺伝子が同定されるに伴い,ほとんどの単因子遺伝疾患原因遺伝子は近い将来同定されるであろう.一つの遺伝子の変異によって発病する病気は5,000種類ほど知られているが,現在1,040種類しか原因遺伝子が同定されてない.単一遺伝子による遺伝病の大半の原因遺伝子が同定されることで,遺伝子検査の種類が飛躍的に増加するものと予想される.また,しばらく時間はかかるが,SNPが網羅的にリストアップされることで,高血圧や糖尿病,動脈硬化症といった多因子遺伝疾患の原因遺伝子の大半が同定されることが予想される.現在SNPにより候補に挙げられた疾患原因遺伝子については表11)のとおりである.
表1 SNPにより候補に挙げられた多遺伝子疾患原因遺伝子(板倉ら)1) 遺伝子 疾患(多遺伝子性) HLA Ulcerative colitis TCR α Rheumatoid arthritis Collagen11(α2) OPLL OOLIA1 Osteoporosis Endothelial NO synthase Familial open-angle glaucoma Apolipoprotein E Age-related mascular degeneration 11β-Hydroxysteroid dehydrogenase End-stage renal disease β Subunit of epithelial sodium channel Essential hypertension in blacks Angiotensin 1 receptor Left ventricular hypertension Fibrinogen β-chain Familial MI Coagulation factor VII MI Coagulation factor VIII MI CYP17 Advanced breast cancer risk CYP2E1 Nasopharyngeal carcinoma PDXI (IPFI) Type2 DM Insukin 5' upstream Type2 DM Aldose redactase Diabetic retinopathy Angiotensinogen Albuminuria in chinese type2 DM Ob(exon1 polymorphism) Leptin concentration Hepatocyte nuclear factor-4α Type2 DM APOE Altzheimer's disease Neutrophin3 Altzheimer's disease Dopamine D3 receptor Schizophrenia Catechol-O-methyltransferase Schizophrenia in Japanese 5HT2A 5' upstream Schizophrenia DRD4 Attension deficit hyperactivity disorder Adenosine receptor Panic disorder Tryptophan hydroxylase Manic depressive illness
3. SNP解析の内外の現状
SNPを変異が存在する領域で分類すると,遺伝子機能に関連するタンパク質のコード領域の変異(cSNP),タンパク質発現調節にかかわる領域の変異(rSNP),それ以外の領域の変異(SNP)の三つに分類できる.
本邦では遺伝子機能に関連するタンパク質のコード領域(cSNP)に焦点をあてたプロジェクトが省庁横断的なミレニアムプロジェクトとして225億の予算のもとに複数開始されている.日本人集団における約15万個の標準SNPデータベースの構築,生活習慣病に関連するSNPの解析が進んでいる1).しかし,非コード領域のSNPも特定遺伝子の近傍にあり,連鎖不均衡に関与するものは,疾患関連遺伝子を見つけだすマーカーとしても有用であり,cSNP以外のSNP全体を同定することは非常に重要である.
海外では,米国のCerela社がPerkin-Elmer社とともに,すでに270万個の疾患関連SNPを同定したと伝えており,これを有償で提供することを発表した2).また,フランスのGenset社は独自のSNP情報から疾患ごとに約50の原因となる候補遺伝子の絞り込みが可能となっているという.SNPの数が約300万個と推定されることから,すでに大半を同定したことになる.
一方,Cerela社らによる特許申請等によるSNP情報の独占を懸念し,英国のGlaxso Wellcome 社など欧米製薬会社10社と5公的研究機関は共同で,SNPコンソーシアムを設立し,現在得られたSNP情報を無償でNIHなどの公的サイト上で一般公開している3).2年間経過した現在,すでに70万個のSNPが同定され,30万個以上がマッピングされている.これは当初の予定を上回る進捗状況であり,24個人からのDNA断片を Gene Bank にあるDNAと比較することで,循環器,糖尿病,アルツハイマー病など頻度の多い疾患の遺伝子マーカーとして25万個のSNPを同定するプロジェクトをも並行して開始している.
表2に有用なSNP情報を入手できるWEBのサイトを挙げたが,前述のTSCのSNPsは質(均一分布性)やマッピング情報(信頼性)ともに非常に良好であり評判が良い.
SNPの解析技術は多くの種類があるが,効率よく安価な方法であることが非常に重視される.多因子疾患の解析をする場合,少なくとも数千人の患者群と対照群においてSNPを決定し,疾患との相関を検討しなくてはならない.仮に,疾患感受性遺伝子を探すために,1,000症例で15万個のSNPを用いて遺伝子解析をすることを想定すると,全体で億単位のジェノタイピングが必要になる.費用を概算すれと,15万個のオリゴヌクレオチドを入手するのに約3億円かかり,たとえ運良くオリゴヌクレオチドを安価に提供されたとしても,DNA抽出だけでもサンプル当たり2,000円として200万円かかる.ジェノタイピングコストはチップを用いた場合,1個当たり50円,マススペクトルで約100円かかり膨大な費用である.また,解析ソフトや装置にも最低2億円が必要とされている.筆者の大学院時代の師,板倉博士が運営されている徳島大学ゲノムセンターなど基幹となるセンターのもとで集約的研究が行われているのは,こうした費用の面からもうなずける.
表2 有用なSNPデータの WEBアドレス ・NCI CGAP-GAI http://lpg.nci.nih.gov/ ・NCBI http://www.ncbi.nlm.nih.gov/ ・HGBASE http://hgbase.cgr.ki.se/ ・The SNP consortium http://snp.cshl.org/ ・ddSNP http://www.ncbi.nlm.nih.gov/SNP/ ・e-PCR Web Resource http://www.ncbi.nlm.nih.gov/
4. 創薬分野におけるSNP
創薬研究において重要な薬物標的分子の探索においても,SNP解析が有用であろう.SNPがすべてリストアップされれば,疾患の再分類が行われ,従来からの表現形からのみに基づいた診断や画一的な治療法が変化していくと予想される.そうなると,より細分化された疾患に対して,より特異的な治療が要求され,明確な分子ターゲットをもった薬物の開発が求められる.
また,今までは患者を選択せず臨床試験を行っていたため,有用性が見いだされず開発がうち切られたような薬剤も,有効性が予想される患者の選別により,あらためて有用性が見いだされるかもしれない.
98年9月に米国での販売認可を獲得したHerceptinという名のヒト化モノクローナル抗体製剤(米,Genentech社)がある.これは上皮細胞成長因子受容体タンパク質2(HER2)を過剰に発現した乳癌患者に限って治療薬として認可された.全乳癌患者の 25〜30% がHER2が過剰発現し,この場合の生命予後は不良とされているため,Herceptinはこうした患者群にとっては非常に有効な薬剤と考えられるものの,乳癌患者全体を対象とした場合には有意な効果がでなくなる.Herceptinは遺伝子多型に基づいた薬剤ではないので,薬物ゲノム学を利用したとはいえないが,遺伝子多型に基づく薬剤開発の道筋を示したものと考えられる.これに関連して,デンマーク,Dako社はGenentech社と協力してHER2の発現量を調べる診断キットを完成させている.このように,治療薬と診断薬を組み合わせた企業の開発戦略が最近よくとられている.
外来遺伝子であるが,遺伝子型を利用している例にはC型肝炎に対するインターフェロン治療がある.インターフェロン治療の効果は,C型肝炎ウイルスの遺伝子型が効果を規定し 2a, 2b では効くとされているため,治療の適応を決める際にウイルス量(少ないほど効く)とともに重要な因子となっている.
また,個人ごとに異なる薬物代謝速度を決定する遺伝子の同定も今後進むに従い,個人ごとに代謝酵素遺伝子がリストアップされると予想される.個人ごとの薬剤の効き方の違いの鍵を握っているのが遺伝子であろうことは何十年も前から予測されていた.ただ,どの遺伝子が影響するかがわかっていなかった.最近になり,薬物の代謝速度が代謝酵素の遺伝子多型により大幅に異なることが,多くの薬物や酵素で証明されている.p450という多くの薬物の代謝に関与する酵素群があり,この遺伝子多型が多くの薬剤の代謝速度を決定していることがわかってきた.本邦の臨床検査会社でもシトクロームP450解析サービスをすでに実施しており,すでに 2C9, 2C19, 2D6 などの遺伝子多型について受け付けており,月間100件以上の依頼があるという.P450に関してはすでにDNAチップも市販されている.こうした技術により薬物に対する感受性を個人ごとに評価して,薬容量を決定することが可能となる.疾患の細分化に伴う治療の細分化,個人ごとの薬物代謝酵素遺伝子多型の解析による至適な薬物負荷量の調節が今後可能と考えられ,個人ごとの医療として,テーラーメード医療といった呼び名が提唱されている.
また,薬剤感受性や副作用における人種差の発生も,薬物ゲノミクスによる解析が可能となり,国際ブリッジング試験の施行が可能となり,より早く臨床応用が可能となると考えられる.
5. SNPと遺伝子検査
疾患の発症に関与するSNP(主にcSNP)の解析が進むにつれて,SNPの多型を対象とした検査項目が増えることが予想される.
SNP多型の検査自体は簡単であるが,正確に再現性をもって行うことは比較的難しい.このため,検査を実施する施設間において,ある程度共通な手法(シーケンスであれば,例えばPCRに用いるプライマーを統一するなど)を確立していく必要があろう.
海外では,Myriad社は癌と関連深いBRCA-1, -2 遺伝子の変異解析を行っている.また,アンギオテンシノーゲン(AGT)多型を1件395ドルで受け付けている.この多型でリスクの高い型を重複して有すると心血管疾患罹患の発症頻度は心筋梗塞で3.4倍と高くなると発表している.
本邦の検査会社では,多くのSNPに関して,受託検査がされている.脂質代謝異常遺伝子検査としては.コレステリルエステル転送タンパク質イントロン14遺伝子多型およびエクソン15遺伝子多型, アポリポタンパク質E遺伝子型 (geno-type), β3 アドレナリント受容体( β3AR)多型がある.循環器疾患遺伝子検査としては,アンギオテンシン転換酵素,アンギオテンシノーゲン,アンギオテンシンタイプ1レセプターといったレニンアンギオテンシン系因子の遺伝子多型が虚血性心疾患などの心疾患発症のリスクの評価に使われている.また,薬物代謝速度を評価する検査としては,シトクロームP450解析として,2C9, 2C19, 2D6 などの遺伝子多型についてが行われている.
これらの検査は結果のもつ意味を十分に検査を依頼された個人に説明する必要があり,遺伝子カウンセラーのいる施設において実施することが望ましい.例えば,一般には父親からきた遺伝子は,父親からもらった染色体として動いているように考えられているが,実際は減数分裂の際に,多くの組み換えが起こり,一つの染色体の遺伝子においても,それが父親からきたのか,母親からきたのか簡単には判別できない.また,ある疾患にかかりやすいといっても,程度の差があり,予防法にも言及しながら,しっかりとした説明を検査を受けた人に行う必要がある.したがって,遺伝子カウンセラーの確立(本邦ではまだ明確な国家資格が存在しない)によるきめ細かい遺伝子カウンセリングが必要である.
遺伝子検査は有益な情報が得られる一方,プライバシーの保護という側面から,個人の遺伝子情報の管理においては細心の注意が必要となる.本邦においても,ヒトゲノム・遺伝子解析研究に関する倫理指針が本年3月に作成され倫理面での規制が作られつつある.
Affymetrix社では,ヒトでのゲノムワイドなSNPs解析用製品として HuSNP Mapping Assay が販売しており1サンプル当たり約1,200の高精度なSNPタイピングが可能である.しかしこの製品はあらかじめ選択されたSNPsのみを解析する連鎖解析用ツールとして大きな絞り込みとして作られたもので,特定の疾患遺伝子のさらなる絞り込みや,特定の染色体領域の検索にはむかない.これに対して,同じAffymetrix社が開発したGenFlexタグアレイは研究者が選択したSNPsを正確にタイピングするジェノタイピング用ツールであり自由度が高く汎用性がある.
お わ り に
ヒトの全ゲノムの塩基配列解析に伴って,未知の遺伝子やSNPが数多く同定されてきている.とりわけSNPを利用することで,単一遺伝子の原因遺伝子の同定はもとより,高血圧や糖尿病,肥満といった多因子遺伝疾患の原因遺伝子の同定される日も間近い.また,薬剤の効き方の個人差も薬剤受容体や代謝酵素の遺伝子多型解析により解明されるであろう.こうしたことから,疾患の診断,治療がより細分化され,いわゆるテーラーメード医療の時代となる.こうした遺伝子検査に
かかる医療費は増加するが,予防医療に結果を活かすことで医療費全体を削減できる可能性はある.ゲノム科学は今後,医療だけでなく,食料・環境問題においても大きな貢献をもたらすと考えられる.
文 献
1) 板倉光夫:ファーマコゲノミクス.ヒューマンサイエンス振興財団調査報告書,2000.
2) Roses, A. D: First International Pharmacogenomics and Pharmacologenetics Forum, 1999.
3) http://www.ncbi.nlm.nih.gov/