화학물질 독성예측과 차세대 위해성평가를 위한 EPA CompTox Chemical Dashboard 활용

Utility of EPA CompTox Chemical Dashboard for Next Generation Risk Assessment and Toxicity Prediction of Chemicals

Article information

J Korean Soc Environ Eng. 2023;45(5):244-255
Publication date (electronic) : 2023 May 31
doi : https://doi.org/10.4491/KSEE.2023.45.5.244
School of Environmental Engineering, University of Seoul, Republic of Korea
김동현orcid_icon, 최진희,orcid_icon
서울시립대학교 환경공학부
Corresponding author E-mail: jinhchoi@uos.ac.kr Tel: 02-6490-2869
Received 2023 March 11; Revised 2023 April 25; Accepted 2023 April 25.

Abstract

전통적인 화학물질 위해성평가의 한계가 명확하게 드러나면서, 독성학 분야의 패러다임이 전환되고 있다. 그 중심에, 다양한 최첨단 기술을 이용해 화학물질의 독성을 평가하는 신규접근법 (New approach methodologies, NAMs)이 있으며, 이는 곧 차세대 위해성평가 (Next generation risk assessment, NGRA) 프레임워크로 구현되고 있다. 이에 미국 환경청에서는 EPA CompTox Chemical Dashboard라는 웹 기반 어플리케이션을 개발해 다양한 데이터를 통합하여 예측기반 독성평가를 지원하고 있다. 이에 본 총설에서는 EPA CompTox Chemical Dashboard에서 제공하는 데이터와 계산독성학 기능에 대한 총체적 분석과 이를 활용한 개별 사례연구를 통해 화학물질 독성예측과 차세대 위해성평가 구현을 위한 EPA CompTox Chemical Dashboard의 활용에 대한 전망을 제시하였다.

Trans Abstract

In recent years, the paradigm of toxicity science is moving toward predictive science. New approach methodologies (NAMs), including in chemico, in silico, and in vitro approach, provides a new feasibility to minimize the whole animal toxicity testing. To support these efforts, the U.S. Environmental Protection Agency (EPA)’s web-based CompTox Chemical Dashboard was developed and providing relevant data through a curation of diverse substances and predictive tools. In this review, we presented a comprehensive analysis of EPA CompTox Chemical dashboard’s available data, predictive tools and recent case studies using them. We also suggested a perspective of utility of EPA CompTox Chemical Dashboard for implementation of next generation risk assessment and toxicity prediction of environmental chemicals.

1. 서 론

현재 1톤 이상의 기존화학물질과 모든 신규화학물질을 수입 및 제조, 사용하기 위해서는 화학물질의 등록 및 평가 등에 관한 법률(이하 화평법)에 따라 등록과 평가를 의무적으로 받아야 한다. 하지만, 화평법 이행을 위한 등록 과정에 소요되는 동물실험 자료는 굉장히 부족한 실정이며, 자료 생산에 상당한 비용과 시간을 초래한다. 뿐만 아니라, 동물실험에 대한 윤리적 문제 또한 꾸준히 제기되어오면서, 국제적 흐름 역시 동물실험을 최소화하고 있는 추세이다[1]. 대표적으로, 유럽연합에서는 2013년부터 생산 과정에 동물실험이 수반된 화장품 성분이나 제품들은 모두 시장에서 퇴출하고 있으며, 미국 환경청(United States Environmental Protection Agency, US-EPA)에서는 2035년까지 화학물질 평가에서 동물실험을 배제하겠다는 목표를 제시하였다(’19). 따라서, 이러한 전세계적인 화학물질의 독성 평가 패러다임 전환의 흐름에 발맞춰, 비(非) 동물 대체시험법의 개발의 수요는 계속해서 증가하고 있다[2].

한편 최근 빅데이터/인공지능 기술이 비약적으로 발전하면서 모든 분야의 혁신을 가져오고 있다. 독성학 분야 역시 이러한 기술을 접목한 계산독성학 (Computational Toxicology) 분야가 함께 부상하고 있다[3]. 계산독성학은 화학정보학과 생물정보학의 인터페이스에 존재하는 기술로서, 대체시험법의 개발을 가속화하는데 활용된다[4]. 인공지능 기술을 포함해 3D 오가노이드, 로봇기술 등 최첨단 바이올로지 기술들이 활용되고 있으며, 이러한 기술에 기반한 예측기반 독성평가 방법론은 이후 신규시험법(New Approach Methodologies, NAMs)라는 개념으로 구체화되었다[5]. 신규접근법은 화학물질의 잠재적 독성을 효율적으로 스크리닝(screening) 할 목적으로 개발된, 위해성평가에 활용되는 모든 새로운 방법을 포괄하는 개념이다. 이러한 신규접근법은 다양한 사례연구들을 통해 화학물질의 위해성평가에 적용될 수 있는 가능성을 보여주었고, 이는 곧 차세대 위해성평가(Next Generation Risk Assessment, NGRA)라는 개념적 프레임워크로 구현되고 있다[6].

이에 독성예측과 차세대 위해성평가를 지원하기 위한 다양한 대규모 프로젝트들이 진행되고 있으며, 해당 프로젝트에서 생산된 데이터들을 공개적으로 활용 가능하게끔 만들어 놓은 플랫폼들 또한 개발되고 있다. 이에 본 총설에서는 독성예측 분야의 화학물질 데이터베이스 중 가장 대표적인 EPA CompTox Chemical Dashboard의 구성, 데이터, 기능에 대해 분석하고, 이를 활용한 사례연구에 대한 분석을 통해 독성예측과 화학물질 차세대 위해성평가를 위한 EPA CompTox Chemical Dashboard의 활용에 대한 전망을 제시하고자 한다.

2. EPA CompTox Chemical Dashboard 개요

EPA CompTox Chemical Dashboard는 미국 환경청의 계산독성학 연구를 지원하기 위해 개발된 웹 어플리케이션으로, 데이터베이스 통합 관리 플랫폼이다[7]. 2016년 8월에 무료로 공개되었으며, 현재까지 약 백만 개 이상의 화학물질의 위해성평가에 활용 가능한 물리화학적 특성, 거동, 노출, 유해성, 용량-반응 관계 데이터와 여러 분석 도구를 제공하고 있다. 플랫폼 개발의 근간이 되는 EPA의 Chemical Safety for Sustainability research 프로그램의 주요 목표는 수많은 화학물질의 잠재적 위험성을 빠르고, 비용 효율적으로 평가하는 것이다. 이러한 목표를 실현하기 위해, EPA 산하의 National Center for Computational Toxicology (NCCT)는 Toxicity Forecaster/Toxicology Testing in the 21st Century (ToxCast/Tox21) 프로젝트를 포함해 다양한 예측독성학 분야의 혁신적인 프로그램을 개발하고 있으며, 이러한 프로그램을 통해 생산된 데이터는 단일 웹 기반 응용 프로그램인 EPA CompTox Chemcial Dashboard에서 통합되어 제공되고 있다.

3. EPA CompTox Chemical Dashboard 구성

EPA CompTox Chemical Dashboard는 ToxCast/Tox21, Exposure Forecasting (ExpoCast), Endocrine Disruptor Screening Program 21 (EDSP21) 등 대규모 연구개발 프로젝트에서 생산된 데이터를 포함하는 DSSTox (Distributed Structure-Searchable Toxicity) 데이터베이스를 중심으로, 사용자 인터페이스에 다양한 데이터와 오픈 소스 위젯과 기능을 탑재해 제공하고 있다(Fig. 1). 제공되는 데이터는 화학물질 위해성평가 전과정에서 요구되는 데이터 전반을 포괄하고 있으며, 현재 활용가능한 기능은 주로 계산독성학 지원을 목적으로 개발된 툴이다.

Fig. 1.

Configuration of EPA CompTox Chemical Dashboard [Williams et al., (2017) J Cheminform 9, 61].

4. EPA CompTox Chemical Dashboard 데이터

EPA CompTox Chemical Dashboard에서 제공하는 주요 데이터는 Table 1에 요약되어 나타나 있다. 대표적으로 화학물질 식별자・구조에 대한 데이터(DSSTox), 물질의 특성에 대한 예측 데이터(ChemProp/QSAR), 동물실험 데이터(ToxValDB), in vitro 시험 데이터(InvitroDB), 물질의 용도・기능 및 제품 데이터(Product & Use Categories, Collected data on functional use), 노출 데이터(Exposure predictions), 고처리량 독성동태 데이터(HTTK) 등이 있다. 이러한 데이터들은 다양한 독성예측, 차세대 위해성평가 사례 연구들에 활용되고 있으며, 보다 상세한 분석은 본 총설의 6절에서 확인할 수 있다.

Data sources provided in EPA CompTox Chemical Dashboard. More detailed and full information is provided on the Website (https://comptox.epa.gov/dashboard/about).

4.1. 화학물질

EPA의 DSSTox 데이터베이스는 2004년에 공개되었으며, 현재까지 약 1,200,059개의 화학물질의 정보를 제공하고 있다(2023년 1월 기준). 해당 화학물질들은 Fig. 2(A)에 나타나 있는 것처럼 단일 화학물질에 대한 상세한 정보를 제공하기도 하고, Fig. 2(B)에 보여지는 것처럼 특정 목적에 맞게 편집된 화학물질 리스트로 제공하기도 한다. 단일 화학물질에 대한 정보는 Table 1에서 소개된 각각의 데이터들에 기반해 제공되고 있다.

Fig. 2.

Search screen of single chemical and chemical list in EPA CompTox Chemical Dashboard. (A) Example of single chemical information (B) Example of chemical list information.

4.1.1. 개별물질

EPA CompTox Chemical Dashboard에서는 2023년 1월 기준으로 417개의 화학물질 리스트를 제공하고 있으며, https://comptox.epa.gov/dashboard/chemical-lists에서 다운로드 받을 수 있다. 화학물질 리스트는 프로젝트, 간행물, 데이터베이스 등으로부터 특정 목적에 맞게 통합되어 제공되고 있으며 대표적으로 우려대상물질(Contaminants of emerging concern, CECs), 규제 대상 물질, 연구 프로젝트 대상 물질 등이 있다(Table 2). 제공되는 우려대상물질은 환경, 식품, 의약품, 화장품 등 다양한 범위를 포괄하고 있으며, 특히 물질의 화학구조 정보를 함께 제공하기 때문에 활용 가능성이 높다. 또 주목할 점은, 국제공동협력 이니셔티브(Accelerating the Pace of Chemical Risk Assessment, APCRA) 사례 연구 대상 물질 목록과 같이, 공동연구 혹은 개별 사례연구의 대상 물질들도 하나의 물질 리스트로 제공되고 있다는 것이다. 신규접근법 데이터를 생산하고 끝나는 것이 아니라 이를 공유해서 불필요한 데이터의 재생산을 최소화해야 할 필요성은 이미 계속해서 화학물질 독성평가 및 규제 분야에서 계속 논의되어 왔다[8]. 따라서 EPA CompTox Chemical Dashboard에서 제공하는 이러한 물질 리스트 통합은 그러한 신규접근법 활용의 전망을 충실히 이행하고 있는 대표적인 사례라고 볼 수 있다.

Example of representative chemical list provided in EPA CompTox Chemical Dashboard.

4.1.2. 제품

제품 내 화학성분에 대한 정량적 데이터는 화학물질의 근거리 노출을 특성화 하는데 효과적으로 활용 될 수 있는 매개변수이다[9]. 이에 EPA CompTox Chemical Dashboard에서는 화학물질 뿐만 아니라, 화학물질 함유 제품에 대한 데이터도 제공하고 있으며 해당 정보는 CPDat(Chemical and Products Database)를 중심으로 16,000개 이상의 제품군의 용도와 기능에 따라 분류된 49,000개 이상의 물질에 대한 데이터를 제공하고 있다. Fig. 3에 보여지는 것처럼 제품을 검색하면 제품내에 존재하는 화학물질 목록에 대한 개별 정보들이 제공되며 전체 제품군의 용도는 제품 카테고리, 제품 유형, 정제된 제품 형태로 분류되어 있다.

Fig. 3.

Search screen of products and chemicals contained in products provided in EPA CompTox Chemical Dashboard. (A) Example of a product (B) Example of chemicals contained in products.

4.2. 어세이

EPA CompTox Chemical Dashboard에서는 ToxCast 연구 프로그램과 관련된 고속처리대량스크리닝(High-throughput screening, HTS) 결과를 배포하고 있다[10]. ToxCast 프로그램은 EPA 내 NCCT에서 운영되며 in vitro 평가법으로 in vivo 수준에서 나타나는 독성 영향을 예측하는 것을 목표로 한다[11]. 단시간에 대량의 데이터를 생산할 수 있는 HTS 기술 덕에 ToxCast 데이터베이스는 현재(2023년 1월 기준) 총 2205개 이상의 어세이와 10,000개 이상의 화학물질 데이터를 제공하고 있으며, 10만메커니즘 기반 화학물질 스크리닝, 인공지능 모델 개발 등에 활용되고 있다[12]. 이러한 개별 어세이에 대한 상세한 데이터 정보는 EPA CompTox Chemical Dashboard Assay Tab는 (https://comptox.epa.gov/dashboard/assay-endpoints)에서 다운로드 받을 수 있다(Fig. 4). ToxCast 데이터 생산에는 15개 이상의 평가 플랫폼이 사용되고 있으며 단순, 단일평가에서부터 복합 판독, 다중화 및 다중 매개변수 기술에 이르기까지 다양하다. 그리고 이러한 각 평가법을 통해 측정 개체 또는 기술적 표적, 평가 종말점에 대한 데이터가 생산된다. 특히 EPA CompTox Chemical Dashboard에서는 개별 화학물질 별로 자세한 in vitro 데이터를 제공하고 있다(Fig. 5). 우리는 이전 연구에서, ToxCast 데이터베이스의 구성과 데이터 처리 과정에 대한 포괄적인 분석과 ToxCast 데이터베이스의 활용전망에 대해 제시한 바 있으며, 더 자세한 내용은 해당 출판물에서 확인할 수 있다[13].

Fig. 4.

Search screen for assay list provided in EPA CompTox Chemical Dashboard.

Fig. 5.

Search screen for bioactivity - ToxCast summary data provided in EPA CompTox Chemical Dashboard: Example of bisphenol A.

5. EPA CompTox Chemical Dashboard의 예측 도구

5.1. Generalized Read Across (GenRA)

상관성 분석(Read Across)은 유사한 구조의 화학물질은 유사한 특성을 갖는다는 전제를 기초로 물리화학적 성질 및 독성을 알고 있는 화학물질의 구조와 유사한 구조를 가진 화학물질의 특성을 예측하는 방법이다[14]. 이에 상관성 분석은 화학물질 규제 의사결정 과정에서 독성 정보가 부족한 물질의 데이터 갭 보충에 유용하게 활용될 수 있다. 하지만 이러한 상관성 분석은 예측에 필요한 유사체를 선정하는 과정에서 전문가 지식이 필요하고, 이는 곧 결과를 주관적으로 해석할 여지가 존재한다는 것을 의미하기에 추론 결과에 대한 신뢰도 및 불확실성을 평가하는데 어려움이 있다는 한계점을 가진다[15]. 따라서 해당 문제를 해결하기 위해 EPA에서는 유사도 가중 평균(similarity weighted average)에 근거해 유사체로부터 화학물질의 특성을 자동으로 예측하는 Generalized Read-across(GenRA) 예측도구를 개발하였으며[16] 현재 EPA CompTox Chemical Dashboard에서 web-based application 기능으로 사용자 인터 페이스에서 활용할 수 있게끔 제공하고 있다(https://comptox.epa.gov/genra/)(Fig. 6).

Fig. 6.

EPA GenRA software execution screen.

GenRA의 기본적인 구동방식은 일반적인 상관성 분석과 동일하게 화학물질의 분자지문(fingerprint)을 이용해 타겟 물질의 유사체를 식별하는 것으로 시작한다. 이후 유사체는 ToxRef_V_1 data내의 1000개 이상의 물질의 in vivo 데이터의 이용가능여부에 따라 자동으로 필터링 된다[17]. ToxRef_V_1 데이터는 10개의 시험 유형(예: 아급성, 아만성, 만성 시험) 내에서 신장 영향, 체중 변화와 같은 독성 영향을 반영하기 위해 이진화 되어있다. 또한 예측데이터는 CHR_liver와 같이 시험 유형(Chronic, 만성), 독성 영향(liver effect)에 대한 정보를 담고 있다. 음성(negative)으로 예측된 결과는 해당 시험 유형에 대해 특정 독성 영향이 나타나지 않았음을 의미한다. 반면 양성(positive)으로 예측된 결과는 시험에서 해당 독성 영향을 나타낸 가장 작은 용량(독성시작점, Point of departure)을 나타낸다. 유사체의 데이터가 식별되면, 유사도 가중 평균법에 의해 타겟 물질의 독성을 양성과 음성으로 판단하게 된다. 이처럼, GenRA 구동 워크플로우는 전문가가 의사 결정을 내리는 방법을 모사하되 유사도 가중 평균법이라고 하는 수학적 모델을 도입함으로써 비전문가의 의사결정을 지원할 수 있게 구현했다[18]. 현재 GenRA에서는 이렇게 구조 유사성에 의존하는 방법 외에도 생체 내 활성 유사도(biosimilarity)에 근거해 판단할 수 있게끔 업데이트 되고 있다(Table 3).

Input data used for implementation of EPA GenRA.

5.2. TEST (Toxicity Estimation Software tool)

EPA TEST (Toxicity Estimation Software tool)는 화학물질의 정량적 구조 활성 관계(Quantitative Structure Activity Relationships, QSARs)에 근거해 화학물질의 특성을 예측하는 기계학습 모델 구동 툴로, EPA CompTox Chemical Dashboard에 web-based application 형태로 내장되어 있다 [10](https://comptox.epa.gov/dashboard/predictions). 별다른 외부 프로그램/코딩 없이도 사용 가능하게 직관적으로 구성되어 있으며, 사용자는 화학물질의 구조를 그리거나 식별 정보를 입력하기만 하면 원하는 결과를 얻을 수 있다[19].(Fig. 7)

Fig. 7.

FEPA TEST prediction software execution screen.

QSARs는 화학물질의 구조로부터 독성을 예측하는 수학적 모델이며, 단순한 QSARs 모델은 화학물질의 특성과 분자 설명자(Molecular descriptors, MD)의 선형 관계를 통해 독성을 예측할 수 있다[20]. 최근, 독성학 분야에서 이러한 QSARs 방법론에 기반한 기계학습/딥러닝 모델이 활발하게 개발되고 있음을 확인한 바 있다[3]. 그 중 EPA TEST는 공신력 있는 규제기관 주도 하에 만들어진 모델이라는 점에서 다른 개별 사례연구로부터 제안된 모델보다 신뢰도 있게 화학물질 규제 의사결정과정에서 활용될 수 있는 잠재력을 가진다. EPA TEST에서 사용하는 QSARS 방법론은 계층적 클러스터링 방법(Hierarchical clustering method), 단일 모델 방법(Single model method), 그룹 기여 방법(Group contribution method), 근접한 이웃 방법(Nearest neighbor method) 등이 있으며, 해당 방법들을 통해 예측된 결과값의 평균이 합의 방법(Consensus method) 결과로 제공된다. 뿐만 아니라, 실제 실험결과가 존재하는 경우 해당 값을 함께 나타내기 때문에 사용자는 예측 결과에 대한 신뢰 수준을 평가할 수 있다. 예측가능한 화학물질의 특성은 독성지표를 포함한 18개이며, 크게 생태독성(Ecotoxicity), 인체독성(Human toxicity), 내분비계 교란 특성(Endocrine disruption), 물리화학적 특성(Physico-chemical properties)으로 구분할 수 있다(Table 4). 각각의 종말점, 데이터세트에 대한 더욱 상세한 설명은 EPA TEST guideline (https://www.epa.gov/chemical-research/toxicity-estimation-software-tool-test)에서 확인할 수 있다.

Toxicological endpoints and Physico-chemical properties predicted by EPA TEST.

6. EPA CompTox Chemical Dashboard 활용

6.1. 화학물질 독성예측

화학물질 독성자료에 기반해 개발된 독성예측모델은 화학물질의 규제 의사결정을 지원하기 위해 여러 사례연구들을 통해 활용되고 있다[21]. 이 중 본 총설에서는 EPA CompTox Chemical Dashboard의 계산독성학 기능들을 활용한 사례 연구를 중점적으로 분석하였다. 대표적으로, 우리가 이전 연구에서 분석한 국제 공동협력 이니셔티브 APCRA 이니셔티브의 사례연구가 있다[8,22,23]. APCRA 이니셔티브는 신규접근법 기반 화학물질 위해성평가의 가속화를 목표로 설립되었으며, 2016년 국제 워크샵[8]을 시작으로 후향적 사례연구를 통해 차세대 위해성평가의 프레임워크를 제안하였다. 특히 캐나다 규제기관 Health Canada를 중심으로 수행된 APCRA 사례연구에서는 규제 인벤토리 물질에 차세대 위해성평가의 프레임워크를 적용하는 과정에서 신규접근법 데이터가 없는 물질에 대해 EPA GenRA를 적용해 데이터 갭 문제를 해결하였다[23]. 이처럼 계산독성학 접근법을 활용하여 독성 정보가 부족한 물질 역시 신규접근법 기반 위해성평가 프레임워크 안으로 통합할 수 있게 되면, 궁극적으로 신규접근법 기반 프레임워크의 적용가능성을 확장 시킬 수 있음을 보여준 좋은 사례연구 모델이 되었다.

개별 사례연구에서도 EPA CompTox Chemical Dashboard에서 제공하는 기능을 이용해 화학물질의 독성을 예측한 접근법을 확인할 수 있다. Smith et al. (2020)은 어린이 제품에서의 유해물질의 대체재 평가를 목적으로 진행된 유해성 확인 파트에서 EPA TEST 모델을 활용하였다[24]. 해당 사례연구에서 확인할 수 있듯, 기존 유해물질을 대체하기 위해서 만들어진 물질이 기대와 다르게 인체 건강 영향을 나타낼 수 있다는 여러 사례들이 보고되면서25,26), 빠른 속도로 독성을 예측할 수 있는 계산독성학 기술이 현재 대체재 물질 관리에 혁신적으로 사용될 수 있는 가능성을 보여주고 있다[27~29]. 이를 통해 독성학 분야에서 계산독성학 기능을 활용한 접근법이 계속해서 중요해질 것임을 전망할 수 있다.

6.2. 차세대 위해성평가

차세대 위해성평가는 신규접근법 기반 in silico, in chemico, in vitro 데이터를 통합하여 위해성평가를 수행하는 개념적 프레임워크이다[30]. 우리는 이전 총설논문에서 차세대 위해성평가의 개념과 전망에 대해 분석한 바 있으며, 해당 논문에서 차세대 위해성평가의 기본 원칙과 최근 수행된 사례 연구들을 확인할 수 있다[31]. 차세대 위해성평가를 구현하기 위해서는 in vitro 데이터 기반 독성시작점을 계산하기 위해 독성동태(Toxicokinetic, TK) 데이터를 이용한 인체등가용량(Human equivalent dose) 변환, 예측 노출량 산정에 사용될 신규접근법 데이터가 필요하다. EPA CompTox Chemical Dashboard에서는 이러한 차세대 위해성평가를 구현하기 위한 in silico, in chemico, in vitro 데이터를 포괄적으로 제공하고 있으며, 이를 활용한 논문들이 출판되고 있다(Table 5). 대표적으로, Wegner et al.(2020)는 22개의 Estrogen receptor (ER) 작용 환경성물질, 그리고 Nicolas et al.(2022)는 709개의 EPA ToxCast 화학물질 라이브러리에 대해 현재 EPA CompTox Chemical Dashboard에서 통합하여 제공하는 데이터를 활용해 화학물질의 우선순위를 설정하였다. 이와 같이, EPA CompTox Chemical Dashboard는 하나의 플랫폼 안에서 물질의 위해성을 신규접근법 데이터에 기반해 효율적으로 평가할 수 있도록 데이터를 제공하고 있으므로 규제 의사결정과정에 활용될 수 있는 가능성이 크다.

Case studies for next generation risk assessment (NGRA) using NAM data provided in EPA CompTox Chemical Dashboard.

7. 결 론

지금까지 살펴보았듯, EPA CompTox Chemical Dashboard의 목적은 신규접근법 데이터와 계산독성학 기능을 활용하여 궁극적으로 화학물질의 차세대 위해성평가를 구현하는 과학적 근거를 제공하는데 있다. 이를 통해 최근 수년간 독성학 분야의 기조가 전통적인 동물실험에 기반한 관찰과학(Observed science)에서 예측과학(Predictive science)로 변화하고 있는 흐름을 가속화하였는데 의의가 있다. 하지만, EPA CompTox Chemical Dashboard의 가장 큰 성과는 수많은 화학물질 데이터베이스를 표준화된 데이터 저장방법을 통해 하나의 플랫폼으로 통합시켜 화학물질의 규제 의사결정 과정을 지원한다는 점에 있다. 특히, 신규접근법 데이터가 신뢰도 있게 규제기관에서 활용될 수 있도록 하는 검증 절차와 연결된다면 그 활용도는 더욱 커질 것이다[34]. 이미 EPA에서는 규제 커뮤니티에서 신규접근법을 수용하는데 필요한 방법의 재현성과 성능을 보장하기 위한 지침을 제공하는 추가 연구를 진행하고 있다[35]. 따라서 앞으로 화학물질 독성평가 및 규제 분야에서 가장 중요하게 고민해야할 점은 ‘어떤 새로운 데이터베이스를 개발할 수 있는가’가 아니라 ‘개발된 데이터베이스를 어떻게 효율적으로 활용할 수 있는가’이다. 국내에서도 최근 변화하는 화학물질 독성평가 패러다임 전환에 발맞춰 여러 화학물질 데이터베이스 및 규제 활용 목적 플랫폼을 개발하고 있다. 앞으로 더욱 효율적인 국내 화학물질 관리를 위해서는 이미 선진적으로 구축된 해외 데이터베이스가 국내 화학물질 관리를 위해 어떠한 방식으로 활용될 수 있는지, 그리고 데이터베이스의 한계가 무엇인지 정확하게 파악해야 한다. 이미 존재하는 데이터베이스를 답습하여 불필요한 자원을 낭비하는 것보다, 활용할 수 있는 것은 활용하고 부족한 부분에 대해 효율적으로 생산하고 개발하는 방향으로 나아가야 한다. 이를 위해선, 현재 국제적으로 활용가능한 데이터베이스에 대한 현황과 구체적인 데이터, 제공 도구 등을 제대로 이해해야 할 필요가 있다. 따라서 본 총설은 그러한 노력의 일환으로 EPA CompTox Chemical Dashboard의 구성, 데이터 현황, 기능 그리고 활용 연구들에 대해 분석하였으며, 이를 통해 화학물질 규제 의사 결정과정에서 EPA CompTox Chemical Dashboard의 데이터를 활용해 독성예측/차세대 위해성평가 프레임워크를 구현할 수 있는 가이드를 제공하였다는 데 의의가 있다.

Acknowledgements

본 연구는 환경부의 재원으로 한국환경산업기술원의 환경성질환 예방관리 핵심 기술개발사업 (2021003310005)의 지원을 받아 수행하였습니다. 이에 감사드립니다.

Notes

Declaration of Competing Interest

The authors declare that they have no known competing financial interests or personal relationships that could have appeared to influence the work reported in this paper.

References

1. Burden Natalie, Mahony Catherine, Müller Boris P, Terry Claire, Westmoreland Carl, Kimber Ian. Aligning the 3Rs with new paradigms in the safety assessment of chemicals. Toxicology 330:62–66. 2015;
2. Punt A, Bouwmeester H, Blaauboer B. J, Coecke S, Hakkert B, Hendriks D. F. G, Jennings P, Kramer N. I, Neuhoff S, Masereeuw R, Paini A, Peijnenburg A. A. C. M, Rooseboom M, Shuler M. L, Sorrell I, Spee B, Strikwold M, van der Meer A. D, van der Zande M, Vinken M, Yang H, Bos P. M. J. M. B. Heringa. ALTEX 37(4):607–622. 2020;
3. Jeong J, Choi J. Artificial intelligence-based toxicity prediction of environmental chemicals: Future directions for chemical management applications. Environ. Sci. Technol 56(12):7532–7543. 2022;
4. Dudek A. Z, Arodz T, Gálvez J. J. Gálvez. Computational methods in developing Quantitative Structure-Activity Relationships (QSAR): A review, Comb. Chem. High Throughput Screen 9(3):213–228. 2006;
5. ECHA, New Approach Methodologies in Regulatory Science: Proceedings of a Scientific Workshop, Helsinki pp. 472016.
6. Dent M. P, Vaillancourt E, Thomas R. S, Carmichael P. L, Ouedraogo G, Kojima H, Barroso J, Ansell J, Barton-Maclaren T. S, Bennekou S. H, Boekelheide K, Ezendam J, Field J, Fitzpatrick S, Hatao M, Kreiling R, Lorencini M, Mahony C, Montemayor B, Mazaro-Costa R, Oliveira J, Rogiers V, Smegal D, Taalman R, Tokura Y, Verma R, Willett C, Yang C. Paving the way for application of next generation risk assessment to safety decision-making for cosmetic ingredients. Regulatory Toxicology and Pharmacology 125:105026. 2021;
7. Williams A. J, Grulke C. M, Edwards J, McEachran A. D, Mansouri K, Baker N. C, Patlewicz G, Shah I, Wambaugh J. F, Judson R. S, Richard A. M. The CompTox chemistry dashboard: A community data resource for environmental chemistry. J. Cheminform 9(1):61. 2017;
8. Kavlock R. J, Bahadori T, Barton-Maclaren T. S, Gwinn M .R, Rasenberg M, Thomas R. S. Accelerating the Pace of Chemical Risk Assessment. Chem. Res. Toxicol 31(5):287–290. 2018;
9. Dionisio K. L, Phillips K, Price P. S, Grulke CM, Williams A, Biryol D, Hong T, Isaacs KK. The Chemical and Products Database, a resource for exposure-relevant data on chemicals in consumer products. Sci. Data 5:180125. 2018;
10. Williams A. J, Lambert J. C, Thayer K, Dorne J. C. M. sourcing data on chemical properties and hazard data from the US-EPA CompTox Chemicals Dashboard: A practical guide for human risk assessment. Environ. Int 154:106566. 2021;
11. Richard A. M, Judson R. S, Houck K. A, Grulke C. M, Volarath P, Thillainadarajah I, Yang C, Rathman J, Martin M. T, Wambaugh J. F, Knudsen T. B, Kancherla J, Mansouri K, Patlewicz G, Williams A. J, Little S. B, Crofton K. M, Thomas R. S. ToxCast chemical landscape: Paving the road to 21st century toxicology. Chem. Res. Toxicol 29(8):1225–1251. 2016;
12. Jeong J, Kim D, Choi J. Application of ToxCast/Tox21 data for toxicity mechanism-based evaluation and prioritization of environmental chemicals: Perspective and limitations. Toxicology in Vitro 84:105451. 2022;
13. Jeong J, Lim C, Woon Jung D. J. Choi. JEAHT 22(2):77–83. 2019;
14. OECD, Joint Meeting of the chemicals committee and the working party on chemicals, pesticides and biotechnology guidance on grouping of chemicals, second edition, Series on Testing & Assessment, No. 194 JT03356214, (2017).
15. Grace P, George H, Prachi P, Imran S. Navigating through the minefield of read-across tools: A review of in silico tools for grouping. Computational Toxicology 3:1–18. 2017;
16. Shah I, Liu J, Judson R. S, Thomas R. S, Patlewicz G. Systematically evaluating read-across prediction and performance using a local validity approach characterized by chemical structure and bioactivity information. Regulatory Toxicology and Pharmacology 79:12–24. 2016;
17. Martin M. T, Judson R. S, Reif D. M, Kavlock R. J. D. J. Dix. Environ. Health Perspect 117(3):392–399. 2009;
18. Helman G, Shah I, Williams A. J, Edwards J, Dunne J, Patlewicz G. Generalized read-across (GENRA): A workflow implemented into the EPA comptox chemicals dashboard. ALTEX 36(3):462–465. 2019;
19. EPA U.S. (version 5.1) (Toxicity Estimation Software Tool): A Program to Estimate Toxicity from Molecular User’s Guide for T.E.S.T 2020.
20. Cherkasov A, Muratov E. N, Fourches D, Varnek A, Cronin M, Dearden J, Gramatica P, Martin Y. C, Todeschini R, Consonni V, Kuz'min V. E, Cramer R, Benigni R, Yang C, Rathman J, Terfloth L, Gasteiger J, Richard A, Tropsha A. QSAR modeling: Where have you been? Where are you going to? J. Med. Chem 57(12):4977–5010. 2014;
21. Porcelli C, Boriani E, Roncaglioni A, Chana A, Benfenati E. Regulatory perspectives in the use and validation of QSAR. A case study: DEMETRA model for Daphnia toxicity. Environ. Sci. Technol 42(2):491–496. 2008;
22. Paul Friedman K, Gagne M, Loo L. H, Karamertzanis P, Netzeva T, Sobanski T, Franzosa J. A, Richard A. M, Lougee R. R, Gissi A, Lee J. J, Angrish M, Dorne J. L, Foster S, Raffaele K, Bahadori T, Gwinn M. R, Lambert J, Whelan M, Rasenberg M, Barton-Maclaren T, Thomas R. S. ility of in vitro bioactivity as a lower bound estimate of in vivo adverse effect levels and in risk-based prioritization. Toxicological Sciences 173(1):202–225. 2020;
23. Beal M. A, Gagne M, Kulkarni S. A, Patlewicz G, Thomas R. S. T. S. Barton-Maclaren. ALTEX 39(1):123–139. 2022;
24. Smith M. N, Cohen Hubal E. A, Faustman E. M. A case study on the utility of predictive toxicology tools in alternatives assessments for hazardous chemicals in children’s consumer products. J. Expo. Sci. Environ. Epidemiol 30(1):160–170. 2020;
25. Huang J, Sun L, Mennigen J. A, Liu Y, Liu S, Zhang M, Wang Q, Tu W. Developmental toxicity of the novel PFOS alternative OBS in developing zebrafish: An emphasis on cilia disruption. J. Hazard Mater 409:124491. 2021;
26. Zhang X, Nagano M. Screening of potential plasticizer alternatives for their toxic effects on male germline stem cells. Biomedicines 10(12):3217. 2022;
27. Rim K. T. In silico prediction of toxicity and its applications for chemicals at work. Toxicol. Environ. Health Sci 12(3):191–202. 2020;
28. Bajard L, Melymuk L, Blaha L. Prioritization of hazards of novel flame retardants using the mechanistic toxicology information from ToxCast and adverse outcome pathways. Environ. Sci. Eur 31:14. 2019;
29. Sun S, Zuo Q, Du M. Y. Li. Toxics 10(12):783. 2022;
30. Dent M, Amaral R, Amores Da Silva P, Ansell J, Boisleve F, Hatao M, Hirose A, Kasai Y, Kern P, Kreiling R, Milstein S, Montemayor B, Oliveira J, Richarz A, Taalman R, Vaillancourt E, Verma R, Vieira O’reilly Cabral Posada N, Weiss C, Kojima H, Ansell J. Principles underpinning the use of new methodologies in the risk assessment of cosmetic ingredients. Computational Toxicology 7:20–26. 2018;
31. Kim D, Choi J. Perspective of Next Generation Risk Assessment (NGRA) using New Approach Methodologies (NAMs): Review on Accelerating the Pace of Chemical Risk Assessment (APCRA) Initiative. Journal of the Korean Chemical Society 67(1):19–27. 2023;
32. Wegner S. H, Pinto C. L, Ring C. L, Wambaugh J. F. High-throughput screening tools facilitate calculation of a combined exposure-bioactivity index for chemicals with endocrine activity. Environ. Int 137:105470. 2020;
33. Nicolas C. I, Linakis M. W, Minto M. S, Mansouri K, Clewell R. A, Yoon M, Wambaugh J. F, Patlewicz G, McMullen P. D, Andersen M. E, Clewell Iii H. J. Estimating provisional margins of exposure for data-poor chemicals using high-throughput computational methods. Front Pharmacol 13:980747. 2022;
34. Patlewicz G, Simon T. W, Rowlands J. C, Budinsky R. A, Becker R. A. Proposing a scientific confidence framework to help support the application of adverse outcome pathways for regulatory purposes. Regulatory Toxicology and Pharmacology 71(3):463–477. 2015;
35. Thomas R. S, Bahadori T, Buckley T. J, Cowden J, Deisenroth C, Dionisio K. L, Frithsen J. B, Grulke C. M, Gwinn M. R, Harrill J. A, Higuchi M, Houck K. A, Hughes M. F, Hunter E. S, Isaacs K. K, Judson R. S, Knudsen T. B, Lambert J. C, Linnenbrink M, Martin T. M, Newton S. R, Padilla S, Patlewicz G, Paul-Friedman K, Phillips K. A, Richard A. M, Sams R, Shafer T. J, Setzer R. W, Shah I, Simmons J. E, Simmons S. O, Singh A, Sobus J. R, Strynar M, Swank A, Tornero-Valez R, Ulrich E. M, Villeneuve D. L, Wambaugh J. F, Wetmore B. A, Williams A. J. The next generation blueprint of computational Toxicology at the U.S. Environmental Protection Agency. Toxicological Sciences 169(2):317–332. 2019;

Article information Continued

Fig. 1.

Configuration of EPA CompTox Chemical Dashboard [Williams et al., (2017) J Cheminform 9, 61].

Fig. 2.

Search screen of single chemical and chemical list in EPA CompTox Chemical Dashboard. (A) Example of single chemical information (B) Example of chemical list information.

Fig. 3.

Search screen of products and chemicals contained in products provided in EPA CompTox Chemical Dashboard. (A) Example of a product (B) Example of chemicals contained in products.

Fig. 4.

Search screen for assay list provided in EPA CompTox Chemical Dashboard.

Fig. 5.

Search screen for bioactivity - ToxCast summary data provided in EPA CompTox Chemical Dashboard: Example of bisphenol A.

Fig. 6.

EPA GenRA software execution screen.

Fig. 7.

FEPA TEST prediction software execution screen.

Table 1.

Data sources provided in EPA CompTox Chemical Dashboard. More detailed and full information is provided on the Website (https://comptox.epa.gov/dashboard/about).

Source Name Version Description URL
DSSTox Prod_dsstox_202202 Cheminformatics backbone of the CCTE’s ToxCast and the multi-agency Tox21 HTS screening programs https://www.epa.gov/chemical-research/distributed-structure-searchable-toxicity-dsstox-database
ChemProp/QSAR (EPA Suite, OPERA, Percepta/ACD Labs, WebTEST) 20191118_ChemPROP Capture measured or predicted property data associated with a particular source substance or list of chemicals https://www.epa.gov/chemical-research/chemical-safety-analytics
ToxValDB V.9.1.1 Collection of animal (in vivo) toxicity study data https://epa.figshare.com/articles/dataset/ToxValDB_v9_1/20394501
InvitroDB V.3.5 (prod_internal_invtirodb_v3_5) Data generated by the ToxCast and Tox21 in vitro high-throughput screening (HTS) programs https://www.epa.gov/chemical-research/toxicity-forecasting
Product & Use Categories prod_factotum_202009 Consumer product and chemical use category information curated from public documents and included in the Chemicals and Products Database (CPDat). Data may not align with current bulk CPDat release https://doi.org/10.23645/epacomptox.5352997
Collected data on functional use Functional_use_data_05242022 Reported chemical functional use data curated from public documents and included in the Chemicals and Products Database (CPDat). Data may not align with current bulk CPDat release https://doi.org/10.23645/epacomptox.5352997
Exposure predictions General-Exposure-Predictions-2022-05-16 Consensus model predictions for daily intake rates (mg/kg BW/day) and contributing predictors such as models and chemical descriptors https://github.com/HumanExposure/SEEM3RPackage
HTTK V2.2.1 High throughput toxicokinetic (HTTK) predictions of chemical absorption, distribution, metabolism, and elimination (ADME) by the body based on either in vitro measurements or structure https://cran.r-project.org/web/packages/httk/index.html

Table 2.

Example of representative chemical list provided in EPA CompTox Chemical Dashboard.

Category Subcategory List Name # Chemicals Link
Environmental PFAS (per- and polyfluoroalkyl substances) PFAS|EPA: PFAS structures in DSSTox (update August 2022) 14735 https://comptox.epa.gov/dashboard/chemical-lists/PFASSTRUCTV5
Food OpenFoodTox FOOD: EFSA OpenFoodTox 4237 https://comptox.epa.gov/dashboard/chemical-lists/EFSAOFT
Drug DrugBank DB CATEGORY|PHARMACEUTICALS: DrugBank database from the University of Alberta 5194 https://comptox.epa.gov/dashboard/chemical-lists/DRUGBANK
Cosmetic COSMOS (COSMetics to Optimise Safety) DB CATEGORY|COSMETICS: COSMOS DB cosmetics database 7021 https://comptox.epa.gov/dashboard/chemical-lists/COSMOSDB
Regulation REACH (Registration, Evaluation, Authorization and Restriction of Chemicals) NORMAN: REACH Chemicals List Provided to NORMAN Network 57756 https://comptox.epa.gov/dashboard/chemical-lists/REACH2017
Collaborative project APCRA (Accelerating the pace of chemical risk assessment) initiative LIST: APCRA Chemicals for Retrospective Analysis 448 https://comptox.epa.gov/dashboard/chemical-lists/APCRARETRO

Table 3.

Input data used for implementation of EPA GenRA.

Criteria Category Subcategory
Neighbors Chemical structure-based fingerprint Morgan fingerprint
Torsion fingerprint
ToxPrintAIM
Biological information ToxCast data
ToxCast data, ATG
ToxCast data, BSK
ToxCast data, NVS
Toxicity ToxRef data
Custom hybrid -
Filtering ToxRef data -
ToxCast data -
Number of analogs ~100

Table 4.

Toxicological endpoints and Physico-chemical properties predicted by EPA TEST.

Category Properties Data type Data source
Ecotoxicity 96-hour fathead minnow LC50 Continuous ECOTOX
48-hour D. magna LC50
48-hour T. pyriformis IGC50 Compilation
Bioconcentration factor
Human toxicity Oral rat LD50 ChemIDplus
Developmental toxicity Binary/ Continuous CAESAR
AMES mutagenicity Compilation
Endocrine disruption Estrogen Receptor RBA Continuous
Estrogen Receptor Binding Binary
Physico-chemical properties Normal boiling point Continuous EPI Suite
Melting point
Vapor pressure
Water solubility
Flash point LookChem
Density
Surface tension Compilation
Thermal conductivity
Viscosity

Table 5.

Case studies for next generation risk assessment (NGRA) using NAM data provided in EPA CompTox Chemical Dashboard.

Reference study Wegner et al. (2020) [32] Nicolas et al. (2022) [33]
Chemical library (# of chemicals) ER agonist activity chemicals (22) ToxCast chemical library (709)
NAM-based hazard data ToxCast bioactivity data
In vitro in vivo extrapolation HTTK R-package
NAM-based exposure prediction ExpoCast