化学シフトファイルの作成方法

生体高分子の化学シフトデータから、BMRBに登録するためのファイルを作成する方法について述べます。
帰属した化学シフトデータは、IUPACの原子命名法に基づいた、BMRB登録用フォーマット(=NMR-STAR形式)で記述される必要があります。

*BMRB登録用の化学シフト作成ツール*
1, NMR-STAR template Generator : NMR-STAR形式のテンプレートファイルを作成
2, STARch file converter : XEASYやSparkyなどが出力する化学シフトファイルをNMR-STAR形式に変換

ここでは、1のツールを使って、タンパク質の化学シフト表の作成を行います。

1. タンパク質の残基配列(1文字表記法、FASTA形式)の文字列を用意

この文字列は帰属が完了した部分ではなく、
配列番号の順番に差異が生じないように測定した生体高分子の完全配列を用います。

例:HHHHHHAFGCRESWQAKCLPHNMVIXSDF

2. NMR-STAR テンプレート作成ツールを開く

NMR-STAR template Generatorを開きます。

ここでは、Data typeは「Assigned chemical shifts」、Residue typeは「polypeptide」を選択します。
(他の種類のNMRデータや生体高分子を選択する場合も、以下の説明を参考にして作成してください。)
ボタンをクリックすると以下のページが開きます。

1. 「1」で用意した残基配列の文字列を、このテキストボックスに入力します。

2. 作成する一覧表に含めたい原子を指定します。
「Atoms observed in routine NMR studies」を選択すると、1H,13C,15Nの化学シフト表の雛形を生成します。
全ての残基原子について生成する場合は“All atoms”を選択
主鎖原子のみを生成する場合は“Backbone atoms (CA, C, N, HA, H) ”を選択

3. 一覧表から除外したい原子を指定することができます。

4. 一覧表に含めたい残基を、限定することができます。
何も入力しなければすべての配列残基について作成されます
「All residues except those selected in the table」を選択すると、チェックした以外の残基について表を作成。

5. 「ambiguity codes」を、チェックします。(「4」で説明)

をクリック。出来上がったテンプレートを、テキスト形式でファイルに保存します。

3. 帰属した化学シフトデータの記入

NMR-STARテンプレートの例
上記のファイルを、テキストエディタかExcelなどで開きます。

NMR-STARテンプレートは、loop_で始まり、stop_で終わる構成になっています。
loopの中には、データの種類を示す「タグ」が縦方向に並び、 その下に、データカラムが横方向に並んでいます。

以下のタグに相当するデータカラムの"@"(アットマーク)部分を、実験のデータと置き換えます。

(例)


4. タグの説明

Ambiguity Code
1 化学シフト値が特定の原子に対してユニークに帰属した場合
2 ジェミナルな原子由来の複数の化学シフト値が観測されたが、それらを特異的に帰属しない場合
例えば、一対のメチレンプロトン(例:ASPのHB2とHB3)、
あるいは二組のメチルプロトン(例:LEUのHD11,HD12,HD13とHD21,HD22,HD23)や
メチル炭素(LEUのCD1とCD2)間で、化学シフト帰属の不明確さ残しておく場合
3 幾何学的に対称な位置にある芳香環プロトン間に不明確な帰属がある場合
(例:TYRのHE1とHE2など)
4 残基内の原子間で不明確な帰属がある場合
(例:LYSのHGとHD、TRPのHZ2とHZ3など)
5 一つの生体高分子内で異なる残基に属する原子間に不明確な帰属がある場合
(例:LYS12のCGとLYS27のCGなど)
6 生体高分子鎖を跨いだ原子間で不明確な帰属がある場合
例えば、非対称な磁気学的環境下にあるホモ2量体で、
一方の生体高分子に属するのASP31のCAと、もう一方の同原子間に不明確な帰属がある場合
9 上記で定義されない不明確さ

もしAmbiguity codeに、“4”、“5”の値を入力した場合・・・

→化学シフト帰属の不明確さに関わる原子の組を定義します。

そのような原子の組が複数あるかもしれません。
ここではそれぞれ組に番号をつけて1つ目のカラムに記入し、
その組に属する、すべての原子の行番号を2つ目のカラムに対応するように記入します。


もし化学シフト表に、値が入らない行があるとき・・・

そのまま残しておいても削除してもかまいません。

削除する場合、行番号“_Atom_chem_shift.ID”は上記のような組の定義に使用される場合もありますので、
連番に直さずそのままにしておきます。
後で、BMRBが組の関連付けを保ったまま、行番号を連続する値に変更します。