1 of 145

July 5, 2024

Jungho Shin

대한금속재료학회 인공지능분과 2024 여름학교

공개 데이터베이스의 소개 및 AI 활용

Chemical Data-driven Research Center in KRICT

2 of 145

데이터 기반 소재 연구의 활용�

3 of 145

소재정보학, Materials Informatics

Materials Science + Informatics

소재 정보를 바탕으로 소재 물성이 나타나는 원리를 이해하여 새로운 소재를 설계〮개발하거나 발굴하는 것으로 기존의 방법론을 혁신

< 기 원 >

Issue at December, 2006 of the MRS Bulletin

“High payoff for developing methodologies that will accelerate the insertion of materials, thereby saving millions of investment dollars.“

John Rodgers of Innovative Materials, Inc.

David Cebon of Cambridge University

4 of 145

소재정보학, Materials Informatics

Materials Science + Informatics

소재 정보를 바탕으로 소재 물성이 나타나는 원리를 이해하여 새로운 소재를 설계〮개발하거나 발굴하는 것으로 기존의 방법론을 혁신

2011 년, “Materials Genome Initiative”

평균 20년이 넘는 소재 개발 기간 및 관련 소요 비용을 단축

소재에 대한 “계산 데이터베이스” 구축

5 of 145

소재정보학 vs 데이터 기반 소재 연구

2022년의 소재정보학 (?)

Materials Informatics vs Data-driven Materials Science

Informatics vs Data science

Materials Genome Initiative :

�“소재 정보를 바탕으로 소재 개발을 혁신 가속화” 소재정보학을 활용

튜링상을 수상한 짐그레이(Jim Gray) 박사 :��데이터 과학은 과학의 네번째 패러다임으로 정의하고 과학(경험, 이론, 계산, 그리고 이제 데이터)에 관한 모든 것이 바뀌고 있음을 시사

6 of 145

4th Paradigm Shift and Digital Transformation

APL Materials 4, 053208 (2016)

Adv. Sci. 6, 1900808 (2019)

Existing dataset

Data-driven Approach

7 of 145

4th Paradigm Shift and Digital Transformation

APL Materials 4, 053208 (2016)

The evolution of digital R&D in chemicals (accenture, ‘21.6)

Adv. Sci. 6, 1900808 (2019)

Digital Transformation

→ Accelerating → Vision

8 of 145

Data Driven Materials Science by Using Materials Big Data

APL Materials 4, 053208 (2016)

The evolution of digital R&D in chemicals (accenture, ‘21.6)

Adv. Sci. 6, 1900808 (2019)

Strategy :

Integration of DB for Community

9 of 145

Data Driven Materials Science by Using Materials Big Data

Adv. Sci. 6, 1900808 (2019)

Strategy :

Integration of DB for Community

The question:

“Why do we need to integrate data repositories?”

which also means,

“What kind of benefits there are if we do integration of data repositories”

10 of 145

Data Driven Materials Science by Using Materials Big Data

Adv. Sci. 6, 1900808 (2019)

Strategy :

Integration of DB for Community

The question:

“Why do we need to integrate data repositories?”

which also means

“What kind of benefits there are if we do integration of data repositories”

“We need to make a perfect(?) dataset including all the materials information�for all the properties, all the applications, all the purpose in the materials science field”

11 of 145

Materials Data in MatDX

Example: DATASET obtained by integration of multiple databases

12 of 145

Materials Data in MatDX

Example: DATASET obtained by integration of multiple databases

Candidate!

13 of 145

Materials Data in MatDX

Example: DATASET obtained by integration of multiple databases

Candidate!

14 of 145

Materials Data in MatDX

Input = Features

of machine learning(ML)

Candidate!

Example: DATASET obtained by integration of multiple databases

15 of 145

Materials Data in MatDX

(Reason) Why do we need to integrate multiple databases?

Input = Features

of machine learning(ML)

Candidate!

Many properties(target) & many metadata(feature)�→ ML for various research purpose(application)

16 of 145

Materials Data in MatDX

KEY : INTEGRATION & CLASSIFICATION

“Map of Materials Information”

Numerous metadata

Multiple databases

17 of 145

ChemDX Materials Ontology

ONTOLOGY = Map of Materials Information

18 of 145

ChemDX Materials Ontology

ONTOLOGY = Map of Materials Information

Class

19 of 145

ChemDX Materials Ontology

ONTOLOGY = Map of Materials Information

Class

Instance

20 of 145

Materials Data in MatDX

21 of 145

Data Processing for Materials Big-data

What kinds of IT skill?

For the integrate of data

Easier solution?

Using ontology → IT process

22 of 145

Construction of Data Warehouse

https://etlpoint.com

IT process

Various format of data

Multiple dadata sources

Required softwares

Interface deired for users

Using ontology → IT process

23 of 145

Construction of Data Warehouse

https://etlpoint.com

IT process

Various format of data

Multiple dadata sources

Required softwares

Interface deired for users

The 2021 MGI Strategic Plan

FAIR Data Principle”

Findable Accessible Interoperable Reusable

for R&D Data Platform

24 of 145

Construction of Data Warehouse

https://etlpoint.com

IT process

Various format of data

Multiple dadata sources

Required softwares

Interface deired for users

The 2021 MGI Strategic Plan

FAIR Data Principle”

Findable Accessible Interoperable Reusable

for R&D Data Platform

25 of 145

Chemical Data eXplorer, ChemDX

https://chemdx.org

26 of 145

Chemical Data eXplorer, ChemDX

https://chemdx.org

27 of 145

Structure of Chemical Data eXplorer

Chemical Analysis

MRA DB

Plastic Degradation

Particulate Matter

Experimental Data Explorer

ExpDX

Materials Applications

28 of 145

Materials Data in MatDX

The original data = Different format or structure of data

“How they can be processed together, and how they can be exposed on the one untied interface”

29 of 145

Materials Data in MatDX

30 of 145

Materials Data in MatDX

31 of 145

Materials Data in MatDX

32 of 145

Materials Data in MatDX

33 of 145

Materials Data in MatDX

34 of 145

ChemDX Materials Ontology

ONTOLOGY = Map of Materials Information

35 of 145

  • Ontology used to match by chemical formula
  • JSON ontology ➜ 773 names defined

"C60": {

"formula": "C60",

"synonym": [

"Fullerene(C60)",

"Fullerene'"

],

"composition": [

"C60"

],

"tags": [],

"class": [

"Substrate",

"Transparent electrode",

"Hole blocking layer",

"Hole transfer layer",

"Hole injection layer",

"Electron blocking layer",

"Metal electrode"

]

},

"Ti foil": {

"formula": "Ti",

"synonym": [

"Ti foil(Metal)"

],

"composition": [

"Ti"

],

"tags": [

"Foil"

],

"class": [

"Substrate",

"Electron transfer layer",

"Metal electrode"

]

},

ChemDX Materials Ontology: Name Ontology

36 of 145

ChemDX Materials Ontology : Extended Name Ontology

  • Ontology to integrate all materials information for individual formulas
  • JSON ontology for updating elasticsearch index

{

"name": "CoSbTi",

"formula": "CoSbTi",

"id": [

"PN_BIODUVLNQWMD4QUJ4GR4EL3L6PHR522H",

"PN_QZF6WQHX3GISDMPW3Y7Z6YJIMSR7J6M6",

"PN_FZUMRSHYD43LX7BJZRRWDJRJJKJDXZHI"

],

"id_es": [

"QjRdBnYBfm5pM-xM9aFO",

"D2GOK3YBUvqzsyfIuGku",

"W4AxLHYBG_O0HHMTsj4p"

],

"composition": {

"compound_type": [

"Ternary"

],

"compound_class": []

},

"structure": {

"dimension": [

"Bulk"

],

"crystal": [

"Tetragonal",

"Orthorhombic",

"Cubic"

]

},

"property": {

"calculation": [

"Fermi energy",

"DOS",

"Total energy",

"Eigenvalues",

"LUMO",

"HOMO"

],

"experiment": []

},

"application": {

"identification": [

"Semiconductor",

"Pauli paramagnet",

"Intermetallic",

"Metal",

"Thermoelectric",

"Semimetal"

],

"substructure": []

},

"reference": {

"calculation": [

"NOMAD"

],

"experiment": [],

"literature": []

}

}

37 of 145

ChemDX Materials Ontology : Tag Ontology

"Oxide": {

"type": [

"composition",

"compound"

],

"synonym": [],

"application": []

},

"Hydrogenperoxide": {

"type": [

"composition",

"compound"

],

"synonym": [

"Oxide"

],

"application": []

},

"Semiconductor": {

"type": [

"application"

],

"synonym": [],

"application": [

"Semiconductor",

"Conductivity"

]

},

"Semiconduct": {

"type": [

"application"

],

"synonym": [],

"application": [

"Semiconductor",

"Conductivity"

]

},

38 of 145

Materials Tags

Fulminate, Metamagnet, Kr, Phyllosilicates, Ba, Charge-density wave state CDW, Semiconductor, Intercalation comp, Hole transfer layer, SFT, Arsenate, Cn, W, VASP 5.2.12, Br, Nanowire, Colossal magnetoresistance CMR, PCE, GBL, Pt, Chloroimide, TTF, Hg, Sulfonate, Cubic, TP, NMP, GIST CMAT, Rg, Antiferroelectric, OTPD, PCDSA, I, Pauli param, PEPOT, Equilbrium Distance, Mag, Telluride, Tc, Imidodisulfonate, Borate, Cyanurate, Mesh, Ureate, Technetate, Superhard, BCP, Ferromagnet FM (?), FTzF, Gd, Luminesc, Transparent, PDTP, Miller Index: (21-31), FM, Imide, Te, Tetrafluorochlorate, Miller Index: (322), Tetragonal, PNDI, Azodioxy-bis[tris(trifluoromethyl)borate], Intermediate vale, Sr, VASP 5.3.2, Electron injection layer, Methyl, EDNC, FEL, Bis(trifluoromethyl-sulfonyl)-amide, DVTPD, EC, PTEBS, Ra, Nitroformate, PCE, Nano, Ferrimagnet, PET, Nanoshell, BenMeIM, Multiferro, Acetylenedicarboxylate, AFM, MHGO, IZO, Pa, Spin glass;, Re, Metal, Au, Giant magnetocaloric effect, PSCDB, Colossal magnetoresistance, Eigenvalues, Thia-triazole-thiolate, Bulk, Superconducto, Alcohol, Spin-density wave state S, Superion, Binding Energy, Unary, Ce, Ds, DIO, SAM, Charge-density wave state, DM, Spin, FiM, Spin glass (?), Trioxotellurate(IV), NTPA, SAMs, PTA, Nanofiber, PPC, Miller Index: (111), Heavy fermion compound, Borocarbide, O, Amidothiophosphate, CDW, KHQSA, ITO, Miller Index: (212), Bromate, Methoxyethanol, Tl, Hydro genperoxide, TTCN, OLED, Semimetal, Ge, Photocatalyst, Rh, Miller Index: (201), APSA, Coverage, Organics, Van Vleck pa, Jsc, Cyanamide, Chloride, Solar Cell,, Hexaoxo-peroxodisulfate, Nitrate, Carbon black, d band, Binary, Hydroxide, TNDI, Superconduct, Intermetallic, High-Tc superconductor, PCBM, Perchlorylamide, BP, Cell area, Non-linear optics NLO, Sp, Cyanamidonitrate, MUTAB, Adsorption, Spin-density wave state, Spin-density wave stat, B, SFX, TTA, Bh, Antiferroelectric AFE, Bis, Fe, Sulfate, TAA, Germanate, O2, Luminescent, Hexaoxotellurate(VI), Miller Index: (011), BPB, ZSO, Cf, Phosphate, PTAA, Perfluoro-butoxide, DFT, Nano-network, Ti, PEDO, Li, Trioxoselenate(IV), Mu, ...

Part of materials tags (total 840 tags)

Solar Cell: application

Semiconductor: application

Binding E: property

PCE: property

Hydroxide: compound type

Nanoshell: mophology

39 of 145

Searching Materials Data on MatDX

Select element and/or material tag

Search results in table

Details about materials

Search materials data from mulitple DB sources

➜ Interative chart directly loaded on web

Statistic : data visualization tools

elasticsearch kibana

568,515�compositions

40 of 145

MatDX Web Service : Home

https://materials.chemdx.org

41 of 145

Search Material Information by Using Material Tags

Using materials tags

42 of 145

Search Material Information by Using Material Tags

NOMAD Repository and Archive

springer_material.classification

43 of 145

Integration of Materials Big-data

44 of 145

Integration of Materials Big-data

45 of 145

Integration of Materials Big-data

46 of 145

Integration of Materials Big-data

47 of 145

Integration of Materials Big-data

48 of 145

Integration of Materials Big-data

49 of 145

MatDX Analysis: Statistics & Visualization of Materials Data

Charts, tables and tag clouds for various subjects in materials science

50 of 145

PubDX & ExpDX & MatDX

51 of 145

API Service on MatDX

52 of 145

MatDX API Dashboard

53 of 145

MatDX API: Search Materials ID

54 of 145

MatDX API: Search Material ID

55 of 145

MatDX API: Downloading Materials Data

56 of 145

소재 공개 데이터베이스 소개�: NOMAD

57 of 145

NOMAD 개요

데이터 컨텐츠 :

  • 계산재료과학 분야 전세계 최대 소재물성 데이터베이스 보유
  • AFLOW, Materials Project, OQMD 데이터 통합 수록
  • 60여종의 서로 다른 프로그램에 대하여 통일된 형식의 데이터 제공

제공 기능 :

  • 사용자가 계산 원본 파일을 업로드 및 공개하여 공유하는 플랫폼
  • 소재 물성 검색/조회/분류/다운로드 및 웹 기반의 AI 분석툴 서비스
  • 화합물의 종류 및 물성에 따른 분류 제공

프로젝트 PI :

  • Matthias Scheffler, Fritz-Haber Institute, Germany
  • Claudia Draxl, Humboldt University of Berlin, Germany

58 of 145

NOMAD Laboratory

59 of 145

NOMAD 웹GUI 활용: 검색 초기화면

60 of 145

NOMAD 웹GUI 활용: 주기율표에 따른 검색

61 of 145

NOMAD 웹GUI 활용: Symmetry 필터

62 of 145

NOMAD 웹GUI 활용: 다중 필터를 이용한 검색

63 of 145

NOMAD 웹GUI 활용: 상세 조회 페이지

64 of 145

NOMAD 웹GUI 활용: 계산 원본 파일 조회

65 of 145

NOMAD Encyclopedia 소개

66 of 145

NOMAD Encyclopedia 소개

  • NOMAD 검색/조회 인터페이스
    • 계산 기반: NOMAD Repository and Archive

    • 물질 기반: NOMAD Encyclopedia

67 of 145

NOMAD Encyclopedia 웹 GUI 활용: 검색 초기화면

68 of 145

NOMAD Encyclopedia 웹 GUI 활용: 화학식 검색

69 of 145

NOMAD Encyclopedia 웹 GUI 활용: 상세화면

70 of 145

NOMAD Encyclopedia 웹 GUI 활용: 구조 정보

71 of 145

NOMAD Meta Info 웹 GUI 활용: 소재물성에 대한 “MetaInfo”

72 of 145

NOMAD Meta Info 웹 GUI 활용: 물질 분류 정보

semiconductor�thermoelectric

Bi16Cs4Te24 검색

73 of 145

NOMAD API 활용 실습

74 of 145

NOMAD 웹GUI 활용: Material 필터

75 of 145

NOMAD 웹GUI 활용: API 명령어 자동 완성

76 of 145

NOMAD 웹GUI 활용: API 웹서비스 접속

77 of 145

NOMAD 웹GUI 활용: API 웹서비스 접속

78 of 145

NOMAD 웹GUI 활용: Swagger Framework

79 of 145

NOMAD 웹GUI 활용: API 명령어 실행

80 of 145

NOMAD 웹GUI 활용: API 명령어 실행

81 of 145

파이썬 활용 데이터 추출 실습�

82 of 145

파이썬 코드를 활용한 MatDX 데이터 추출

83 of 145

파이썬 코드를 활용한 MatDX 데이터 추출 및 처리

84 of 145

3. 응용분야별 데이터 플랫폼 구축 및 AI 활용 연구

85 of 145

데이터 플랫폼 구축 현황

86 of 145

응용분야별 데이터 플랫폼 구축 현황

소자 제작 자동화

OPD 플랫폼 고도화

광전효율�기계학습 예측

국제공동연구 확장

JV 측정�

다이오드

유전특성 등�

촉매 성능�

고분자 합성

전이학습 및�앙상블 기법 예측

높은 유리전이온도�합성 조건

폴리이미드 &�환형 올레핀

태양전지

불소고분자

유기광다이오드

암모니아 전환 촉매

고기능고분자

자동화를 통한�데이터 생성

NH3 합성 촉매�데이터

NH3 합성�반응조건 최적화

데이터 수집�플랫폼 개발

87 of 145

데이터 공개를 위한 플랫폼 구축 현황

유해성 및 노출 데이터

인장 물성, 표면 조도 등 데이터

플랫폼 고도화

HR-LC-MS/MS 활용 비표적�대사체 확인 (in 제브라피쉬)

위해성 DB 보완

노출(반휘발성유기화합물)�데이터 수집 및 DB 수록

플랫폼 고도화

광열화 시험 표준�및 시험법 개발

(미세먼지 OC 성분)

화학분석센터

(화합물 위해성)�화학분석센터

(플라스틱 열화물성)

신뢰성평가센터

88 of 145

페로브스카이트 태양전지 컨소시엄 구성 및 공동 활용 플랫폼 구축

  • 페로브스카이트 태양전지 컨소시엄을 구성하여 10개 그룹이 참여한 데이터 플랫폼을 구축
  • 컨소시엄 데이터를 통합 및 관리가 가능하도록 기존 플랫폼 전면 개편
  • 편리한 입력 구조, 에러 최소화, JV measurement data parser 추가 개발

89 of 145

페로브스카이트 태양전지 컨소시엄 구성 및 공동 활용 플랫폼 구축

  • 로봇팔 기반 페로브스카이트 태양전지 제작 자동화 공정 구축
  • 자동화 공정으로 생산한 소자 성능이 사람의 제작 성능에 거의 근접
  • 자동화 공정 활용 비용매(antisolvent) 스크리닝 실험 진행

화학연 셋업 소자 제작 자동화 시스템 (W3동 108호)

페로브스카이트 태양전지 제작 소자 구조

연구자 vs 자동화 시스템 소자 제작 결과 비교

자동화 공정 활용 비용매(antisolvent)�스크리닝 실험 결과

90 of 145

대학 실험그룹 공동 연구

  • 2D 소재 : AI 활용 이미지 처리 및 고품질화
  • 결정구조 다양성 고려 관련 AI 기술 확보

페로브스카이트�태양전지 컨소시엄

2D 소재

서울시립대 & 포항공대

인공지능�한국과학기술원

JV 커브 측정 데이터

이미지 데이터 처리

AI 모델 구축 및 검증

플랫폼 고도화 및 기계학습 논문 제출

: 서울시립대 장영준 교수 연구팀

가시화 기능 고도화 및 광학 이미지 품질 향상

: 포항공대 김종환 교수 연구팀

구조 기반 인코더

화학식 기반 인코더

소재 물성 예측

밴드갭

형성엔탈피

공동 활용 플랫폼을 통한 데이터 수집

91 of 145

AI 활용 공동 연구

92 of 145

연구원내 실험 그룹 공동 연구 : AI 활용

  • 암모니아 합성 촉매 공정조건 최적화
  • 2.8 wt% - Ru/CeO2 촉매
  • NH3 합성 mol fraction 데이터 생성

폴리이미드 및 환형 올레핀 고분자 데이터에 적합한 신규 플랫폼 개발

Best data 발견 후

최대값 감소

Best data 발견 후

최대값 감소

메탄 전환 촉매 → 암모니아 합성 촉매

불소 고분자 → 폴리이미드

높은 유리전이온도(Tg)

→ 고분자 합성 조건 도출

→ 실험을 통한 검증

93 of 145

고분자 표준물질 데이터 수집 및 AI 활용 연구

고분자 분석 데이터 측정·수집 및 예측 분석기술 개발

- 물성정보와 연계한 고분자 복합체 연구장비 분석데이터 측정 및 수집

- 그래프 인공신경망 기반의 IR 스펙트럼 분석 인공지능 방법론을 개발

94 of 145

응용분야별 데이터 템플릿 공개

  • 촉매, 고분자, 열전소재, 페로브스카이트 태양전지, 유기태양전지(OPV), 유기광다이오드(OPD) 분야에서 현재 데이터 수집에 활용되고 있는 Template를 엑셀 파일 형태로 20건 공개하였으며, 관심 있는 사용자들이 손쉽게 다운로드하여 활용할 수 있는 서비스 시스템을 구축하였음.
  • 데이터 자동 추출(표준화, 구조화) 및 가시화 기술과 연계

95 of 145

최근 주요 연구 업적

플랫폼 소개 논문

AI 활용 논문 (자체 연구)

AI 방법론 논문 (자체 연구)

화학데이터기반연구센터

화학데이터기반연구센터

화학데이터기반연구센터

96 of 145

주요 연구 업적

97 of 145

주요 연구 업적

98 of 145

고분자 표준물질 분석 데이터 플랫폼

99 of 145

고분자 표준 화학물질

  • 하나 이상의 특성 값이 충분히 균일하고 잘 확정되어 있는 물질
  • 측정기기 교정, 측정방법 평가 또는 재료에 값을 부여하는데 사용
  • 알려진 고분자 표준 물질 → 미지의 고분자 물질의 검출∙확인∙정량

고분 표준 화학물질 분석데이터

100 of 145

고분자 표준물질 분석 데이터 수집과 활용

(활용 예시) 미세 플라스틱 성분 확인

(활용 예시) 고분자 블렌드 및 첨가제 물질에 따른 물성 예측: AI 활용

Front. Mater., 09 November 2021�Sec. Polymeric and Composite Materials

101 of 145

고분자 데이터의 특성 : 조성 및 구조 측면

소재의 구조에 기반한 물성 예측 연구 ”R&D 데이터 플랫폼”

유기 분자 및 결정 구조와의 차이점?

MRS BULLETIN

JULY 2019, 44, 524

Educational and Outreach Projects from

the Cottrell Scholars Collaborative

Undergraduate and Graduate Education,

Volume 1, Chapter 4, 65-89

구조 정보 처리를 위한

“Descriptor”

VS

CK-12 Life Science for Middle School, Chapter 2.2

Z. Kristallogr. NCS (2019), 234(3), 421–422

MATSE 81 Materials In Today's World (https://www.e-education.psu.edu/matse81/), Lesson 8

102 of 145

고분자 데이터의 특성 : 구조 정보 Descriptor

유기분자 및 결정 구조 Descriptor

고분자 Descriptor

Chem. Rev. 2022, 122, 12, 10899–10969

Phys. Rev. Lett. 120, 145301 

materialstoday 21(7), 785-796

103 of 145

상용 고분자의 프로필 수집

(향후) 검증된 라이브러리 구축 예정

CAS Number

9011-14-7

104 of 145

상용 고분자의 프로필 수집

(향후) 검증된 라이브러리 구축 예정

CAS Number

9011-14-7

105 of 145

CAC 플랫폼 소개

고분자 물질 911 종 & 분석 데이터 건수 2,419 건 업로드 진행 중

https://cac.chemdx.org

106 of 145

CAC 플랫폼 소개

https://cac.chemdx.org

FAIR Data Principle”

Findable Accessible Interoperable Reusable

for R&D Data Platform

107 of 145

고분자 표준물질 분석데이터: Elemental Analyzer (NCHS)

분석기법

회사명

모델명

장비명

EA(CHNS)

Thermo Scientific

Flash 2000

Elemental Analyzer (NCHS)

108 of 145

고분자 표준물질 분석데이터: Elemental Analyzer (O)

분석기법

회사명

모델명

장비명

EA(O)

Thermo Finnigan

FLASH EA-1112 Series

Elemental Analyzer (O)

109 of 145

고분자 표준물질 분석데이터: EDS

분석기법

회사명

모델명

장비명

EDS

Bruker

Quantax 200

Energy Dispersive X-ray Spectrometer(EDS)

110 of 145

고분자 표준물질 분석데이터: UV-vis

분석기법

회사명

모델명

장비명

IR

Bruker

ALPHA-T / ALPHA-P

Infrared Spectrometer (IR)

111 of 145

고분자 표준물질 분석데이터: Raman

분석기법

회사명

모델명

장비명

Raman

Nanophoton

Ramanforce

Raman spectrometer (Raman)

112 of 145

고분자 표준물질 분석데이터: TG-DTA

분석기법

회사명

모델명

장비명

TG-DTA

Rigaku

Thermo plus EVO II TG8120 series

Thermogravimetric Differential Thermal Analyzer(TG-DTA)

113 of 145

고분자 표준물질 분석데이터: SAXS/WAXS

분석기법

회사명

모델명

장비명

SAXS/WAXS

XEUSS

3.0 COMPACT

Small angle X-ray scattering (SAXS)

114 of 145

고분자 표준물질 분석데이터 (향후 추가 예정)

분석기법

회사명

모델명

장비명

UV-vis

SCINCO

S-4100

Ultraviolet/Visible Spectrometer (UV/Vis)

DSC

Rigaku

Thermo plus EVO II DSC8230

Differential Scanning Calorimeter (DSC)

NMR

Bruker

AVANCE Ⅱ

500MHz NMR Spectrometer

Density

Micromeritics

Accupyc II 1340

Gas Pycnometer

LC

Agilent Technologies

1200series

Liquid Chromatograph (LC)

LC-MS

Waters

ACQUITY UPLC H-Class�/ SQD2 Mass Spectrometer

LC Mass Spectrometer (LC-MS)

GC

Agilent Technologies

6890N

Gas Chromatograph (GC)

GC-MS

Agilent Technologies

6890N 

GC Mass Spectrometer (GC-MS)

115 of 145

CAC 플랫폼 소개

116 of 145

CAC 플랫폼 소개

117 of 145

CAC 플랫폼 소개

118 of 145

CAC 플랫폼 소개

119 of 145

CAC 플랫폼 소개

120 of 145

CAC 플랫폼 소개

Image | Zoom in∙out | Pan | Auto scale | Reset | Save(CSV)

121 of 145

소재 온톨로지의 이해

: 시맨틱 기술 활용 측면

122 of 145

인공지능 기술의 발전

강인공지능 = 인간을 완벽하게 모방한 인공지능�약인공지능 = 유용한 도구로써 설계된 인공지능

123 of 145

인공지능 백과사전

Dr. Know (다알아 박사)

124 of 145

인터넷을 통한 정보 획득

정보의 근원 ≈ 인터넷 ≈ 지구 상 최대의 문건 저장고 ≈ 인류 지식의 총체

대학원생 A씨: 백금보다 유용한 연료전지 촉매를 만들려면 어떻게 해야 하나요?

125 of 145

인터넷을 통한 정보 획득

126 of 145

시멘틱 웹서비스

미래에는 인공지능 백과사전이 더욱 정확한 답을 알려줄까요?

"시멘틱 웹서비스"란?

여러 개의 웹문서에서 얻은 정보를 사용자의 요구에 맞게 정리해서 보여주는 것

➜ 수 십 편의 논문을 분석하여 보고서를 작성하는 연구자의 작업을 대체할 수 있음

[ 배경 ]

백금 촉매의 역할

[ 문제점 ]

백금 촉매 = 고가

[ 한계 ]

저가 촉매 도입 X

[ 극복 ]

연구 중인 후보군

[ 제안 ]

AxBy 후보 물질

127 of 145

시멘틱 웹서비스 구축을 위한 온톨로지 기술

인공지능 백과사전과 같은 시멘틱 웹서비스 구현은 먼 미래의 기술?

➜ 지식공학의 방법론을 활용하여 관련 요소 기술들이 활용되기 시작 하였음

요소기술 = "온톨로지" (ontology)

소재 분류

소재

응용분야

디바이스

백금

전기화학

촉매

환원전극

연료전지

대체물질

PtCu

구리

비귀금속

귀금속

배경 (디바이스 및 응용분야 문건) + 문제점 및 한계 (소재 분류 관련 문건) + 극복 및 제안 (소재 관련 문건)

128 of 145

Name ontology의 확장에 의한 정보의 통합 및 구조화

Name Ontology

Structure

Property

Composition

Application

Conductivity

Metallity

E-harvesting

Magnetizm

E-related

LUMO

HOMO

DOS

Antiferro. Mag.

Voc[V]

Jsc[mA/cm2]

P.C.E[%]

Solar cell

Thermoelectric

F.F.

Semiconductor

Dimension

Crystal system

3D - bulk

Cubic

Hexagonal

NiO

Compound class

Arity

Binary

Oxide

Formula

Name

MatDX

Nometal

Elec. Transfer

Bands

NOMAD

CalcDX

CMiB

SpringerMaterials Lib.

129 of 145

Name ontology에 기반한 정보의 맵핑

NiO

Structure

Property

Composition

Application

Name

Compound class

Arity

Binary

Oxide

Dimension

Crystal system

3D - bulk

Cubic

Hexagonal

Conductivity

Metallity

E-harvesting

Magnetizm

Antiferro. Mag.

Solar cell

Thermoelectric

Semiconductor

Nometal

130 of 145

응용분야에 기반한 정보의 맵핑

Structure

Property

Composition

Application

Compound class

Arity

Binary

Oxide

Dimension

Crystal system

1D - particle

Cubic

Monoclinic

Conductivity

Metallity

E-harvesting

Magnetizm

Antiferro. Mag.

Thermoelectric

Semiconductor

Nometal

Solar cell

Name

Ternary, …

Halide, …

NiO

FAI

2D - surface

3D - bulk

Hexagonal

Trigonal

131 of 145

주요사업 결과보고: 온톨로지 활용 데이터 분류

NiO

Structure

Property

Composition

Application

Name

Compound class

Arity

Binary

Oxide

Dimension

Crystal system

3D - bulk

Cubic

Hexagonal

Conductivity

Metallity

E-harvesting

Magnetizm

Antiferro. Mag.

Solar cell

Thermoelectric

Semiconductor

Nometal

132 of 145

온톨로지 활용한 데이터 시각화 & 구조화

NiO

Structure

Property

Composition

Application

Name

Compound class

Arity

Binary

Oxide

Dimension

Crystal system

3D - bulk

Cubic

Hexagonal

Conductivity

Metallity

E-harvesting

Magnetizm

Antiferro. Mag.

Solar cell

Thermoelectric

Semiconductor

Nometal

< NiO 화합물 >

  • Composition
    • Arity: Binary
    • Compound class: Oxide
  • Structure
    • Dimension: 3D - bulk
    • Crystal system: Cubic, Hexagonal
  • Property
    • Experiments: P.C.E.[%], Jsc[mA/cm2], Voc[V], F.F.
    • Calculations: Bands, DOS, HOMO, LUMO, Eigenvalues, Total energy
  • Application
    • Semiconductor, Metal, Thermoelectric, Solar cell - Electron transfer layer (ETL)
  • Reference: NOMAD, CMiB, SpringerMaterials, CalcDX

133 of 145

온톨로지 활용한 데이터 시각화 & 구조화 & 문서 생성(NLP)

NiO

Structure

Property

Composition

Application

Name

Compound class

Arity

Binary

Oxide

Dimension

Crystal system

3D - bulk

Cubic

Hexagonal

Conductivity

Metallity

E-harvesting

Magnetizm

Antiferro. Mag.

Solar cell

Thermoelectric

Semiconductor

Nometal

< NiO 화합물 >

NiOcubic 또는 hexagonal 결정 구조를 취하고 NiO로 이루어진 binary oxide이다. 이 화합물은 semiconductor, nometal, thermoelectric 특성을 나타내며 활용되는 application으로는 solar cell[1]이 있다.

[1] Solar cell 디바이스의 ETL(Electron Transfer Layer)로 쓰인다.

MatDX 웹서비스에서는 solar cell application과 관련하여 P.C.E. [%], Jsc [mA/cm2], Voc [V], F.F.의 실험 물성 및 bands, DOS, HOMO, LUMO, eigenvalues, total energy의 계산 물성을 제공하고 있다.

구조적인 구분에 따라 소재 정보의 출처는 다음과 같다.

1D - Particle No entry

2D - Surface No entry

3D - Bulk NOMAD, CMiB, CalcDX, SpringerMaterials

134 of 145

응용분야에 기반한 정보의 맵핑

Structure

Property

Composition

Application

Compound class

Arity

Binary

Oxide

Dimension

Crystal system

1D - particle

Cubic

Monoclinic

Conductivity

Metallity

E-harvesting

Magnetizm

Antiferro. Mag.

Thermoelectric

Semiconductor

Nometal

Solar cell

Name

Ternary, …

Halide, …

NiO

FAI

2D - surface

3D - bulk

Hexagonal

Trigonal

135 of 145

온톨로지 활용: Semantic Publishing 사례

  • 문서의 구조에 대한 온톨로지

136 of 145

온톨로지 활용: Semantic Publishing 사례

  • 문서의 구조에 대한 온톨로지를 활용한 Semantic Web: 이미 저널의 웹 아티클 등을 통해 익숙한 서비스

137 of 145

온톨로지 활용: Semantic Enhancement

  • 문서의 구조에 대한 온톨로지를 활용한 Semantic Web ➜ Semantic Enhancement: 이미 저널의 웹 아티클 등을 통해 익숙한 서비스

138 of 145

독일 SIEMENS의 디지털 전환

SIEMENS

  • 독일에 있는 유럽 최대의 엔지니어링 회사
  • 자동화 및 제어, 에너지, 전력 발전, 철도, 의료 등 10개의 주 사업부문을 가진 복합기업
  • 디지털 인더스트리 : 자동화, 제어시스템, 문서화 및 소프트웨어 등에서 선진 기술 보유

139 of 145

SIEMENS의 온톨로지 활용

온톨로지를 활용한

단 하나의 지식 공유 모델

140 of 145

SIEMENS의 온톨로지 활용

모델링 편의성

데이터 통합

재활용 이점

상호 운용성

141 of 145

온톨로지 활용한 데이터 시각화 & 구조화 & 문서 생성(NLP)

NiO

Structure

Property

Composition

Application

Name

Compound class

Arity

Binary

Oxide

Dimension

Crystal system

3D - bulk

Cubic

Hexagonal

Conductivity

Metallity

E-harvesting

Magnetizm

Antiferro. Mag.

Solar cell

Thermoelectric

Semiconductor

Nometal

< NiO 화합물 >

NiOcubic 또는 hexagonal 결정 구조를 취하고 NiO로 이루어진 binary oxide이다. 이 화합물은 semiconductor, nometal, thermoelectric 특성을 나타내며 활용되는 application으로는 solar cell[1]이 있다.

[1] Solar cell 디바이스의 ETL(Electron Transfer Layer)로 쓰인다.

MatDX 웹서비스에서는 solar cell application과 관련하여 P.C.E. [%], Jsc [mA/cm2], Voc [V], F.F.의 실험 물성 및 bands, DOS, HOMO, LUMO, eigenvalues, total energy의 계산 물성을 제공하고 있다.

구조적인 구분에 따라 소재 정보의 출처는 다음과 같다.

1D - Particle No entry

2D - Surface No entry

3D - Bulk NOMAD, CMiB, CalcDX, SpringerMaterials

142 of 145

전자연구노트

자유 형식 = 프리 텍스트 입력

인공지능이 정보를 스스로 분류하고 표준화하여 DB에 저장

143 of 145

소재 온톨로지 활용: 시맨틱 출판 (Semantic Publishing)

  • 생성형 AI : 시맨틱 출판 & ChatGPT

https://chat.openai.com/chat

144 of 145

자연어 처리 프로세스 (NLP, Natural Language Processing)

자연어로 소통이 가능한 챗봇 서비스

145 of 145

감사합니다.