Antibody Structure & Numbering

작성 중

Table of Contents

Immunoglobulin 이란?

왜 항체 넘버링 (antibody numbering)이 중요한가?

항체 가변 부분 (variable domain)의 넘버링 방법들

Antibody Numbering Packages

1. Abnum

2. ANARCI

References

Immunoglobulin 이란?

Immunoglobulin (Ig) 이라고도 불리는 antibody (항체)는 분자량 약 150kDa 정도의 glycoprotein의 일종이며

Y

자 모양을 하고 있다.

Figure from Wikipedia

Ig은 왼쪽 그림의 구획을 기준으로 아래 세 가지 방법으로 구분할 수 있다.

•

Heavy chain / Light chain

H chain	VH, CH1, CH2, CH3
L chain	VL, CL

•

Variable region / Constant region

V	VL, VH
C	CL, CH1, CH2, CH3

•

Fab (antigen binding) / Fc (crystallizable)

Fab	VH, VL, CH1, CL
Fc	CH2, CH3

Figure from Mirsky et al. 2015

이 중 variable region (VR)은 또 CDR과 FR로 구분할 수 있다.

	이름	VR의 구성비율	종류	특징
CDR	Complementarity determining region	~15%	CDR1~3	서열의 길이, 조성의 다양성과 구조적 다양성이 높다.
FR	Framework region	~85%	FR1~4	구조적으로 보존이 많이 된 부분이며, VR의 중심 역할을 하는 $\beta$ -sheet 구조를 이룬다. CDR을 지탱하여 구조적 안정성을 제공하지만, 어떤 경우는 Ag-Ab 결합에 직접 관여하기도 한다.

참고) 때때로 이해하기 쉽게 설명하기 위해서 CDR을 paratope (antibody가 antigen과 결합하는 부분)과 동의어로 설명하는 경우가 있지만, numbering rule에 따라 서로 지칭하는 것이 다른 경우가 있다.

왜 항체 넘버링 (antibody numbering)이 중요한가?

다른 단백질들과 마찬가지로, 항체도 각 residue 별로 순서를 1, 2, 3, …으로 할당해준다. 그렇다면 그냥 순서대로 1부터 전체 길이만큼만 나열하면 되는 쉬운 문제 아닐까?

안타깝게도 그렇지 않다. 항체는 서로 다른 항체끼리의 서열의 유사도가 매우 높고, 아주 일부분의 비슷하지 않은 부분이 항원-항체 결합 친화도에 아주 큰 영향을 미치기 때문에 그 비슷하지 않은 부분의 insertion, deletion이 잘 티가 나도록 숫자를 매기는게 중요하다.

그렇다면 좀 더 원론적으로 들어가서, residue 별로 순서를 왜 매길까?

순서는 residue의 아이디 역할을 하기도 하지만, 더 중요한 이유는 우리가 어떤 항체를 디자인할 때, 어떤 부분을 유지하고 어떤 부분을 바꿔야할지 결정을 해야하기 때문이다.

특히, CDR 부분이 항원과의 상호작용에 중요한 역할을 한다고 하는데, 도대체 어디부터 어디까지를 CDR이라고 정의하는지 알아야 항체 설계를 시작할 수 있다.

참고

항체 가변 부분 (variable domain)의 넘버링 방법들

전 세계적으로 널리 사용되는 numbering scheme은 크게 6가지가 있다.

1. Kabat

1970년도에 Kabat과 Wu가 77개의 Bence-Jones protein과 Ig light chain 서열을 정렬했고, 이때 각 residue의 위치별 variability parameter 를 정의했다.

참고) variability parameter

이들은 이 결과를 분석하면서 H chain 과 L chain에서 variable region 안에서 매우 variability가 높은 세 부분을 찾아내었고, 이 부분들이 단백질이 접힌 상태에서 한 쪽 부분에 몰려서 존재하여 complementarity 를 결정할 것이라고 추측하였다. 이들이 이 hypervariable region을 CDR 이라 명명하였다.

1979년에 Kabat과 그 연구진은 Ig의 variable region을 numbering 하는 표준화된 방법을 처음으로 제시하였다. 그들이 CDR 이라고 정의한 구역에서 insertion이 빈번하게 발생했고, 이런 insertion에 27a, 27b, … 등 alphabet이 추가로 붙은 residue number를 부여했다.

Kabat numbering이 역사적인 의미도 있고, 나름 잘 정의되어 있어 많이 사용되었지만, 몇 가지 한계점이 있다.

•

Alignment를 할 때 sample 수가 많지 않았고, 가장 일반적인 길이의 서열만 사용되었다.

즉, 특이한 insertion/deletion이 있거나 길이가 일반적이지 않으면 Kabat numbering이 잘 맞지 않는다.

하지만 이 단점은 새로운 variable length에 대해 insertion/deletion을 찾는 tool (ABnum 등)을 사용하면 다소 극복할 수 있다는 의견도 있다.

•

Antibody의 3D 구조와 잘 맞지 않는 경우가 꽤 있다.

즉, Kabat에서 CDR로 정의하는 부분과 antigen-binding loop 부분이 일치하지 않는 경우가 꽤 있다.

2. Chothia

1987년에 Chothia와 Lesk가 Ig의 variable region을 numbering 할 때 사용할 수 있는 structure 기반의 numbering scheme을 제안하였다. 그들은 antibody의 variable region의 crystal 구조를 정렬하고 CDR을 구성하는 loop 부분을 정의하였다.

또한, canonical structure 라는 개념을 제시하였다. Chothia와 연구진은 CDR의 구조를 분석해봤을 때, CDR H3를 제외한 L1, L2, L3, H1, H2 부분이 각각 구조적으로 어느 정도 고정되어 있다는 것을 발견했다. 그리고 그 구조들을 결정하는 것은 그 특정 CDR loop의 ‘서열의 길이’와 ‘hallmark position에서의 특정 아미노산의 존재 유무’로 추정된다고 주장했다. 오히려 ‘서열’ 그 자체 보다 길이와 hallmark position에서의 아미노산이 더 중요하다는 이야기이다.

Chothia numbering의 장점: Kabat numbering에 비해서 실제 crystal 구조 상에서의 loop 부분과 잘 맞는다.

Chothia numbering의 한계점

•

Kabat 이나 IMGT에 비해 활용 빈도수가 낮다 (2018년 기준이라 틀릴 수도)

•

Chothia와 그 연구진이 insertion point를 바꾸는 일이 있었어서, 버전에 따라 혼동이 있을 수 있다.

◦

1989년에 CDR L1의 insertion point를 L30에서 L31로 바꿨다가, 1997년에 다시 L30으로 바꾸는 일이 있었다.

◦

1997년에 λ\lambdaλ light chain의 insertion point를 L93에서 L95로 바꾸는 일이 있었다.

•

Kabat과 마찬가지로 CDR sequence length의 다양성이 떨어진다.