Universitätsbibliothek Wien

Artificial Intelligence in Theoretical Chemistry

Gastegger, Michael (2017) Artificial Intelligence in Theoretical Chemistry.
Dissertation, University of Vienna. Fakultät für Chemie
BetreuerIn: Marquetand, Philipp

[img] PDF-File
Alle Rechte vorbehalten / All rights reserved

Download (9Mb)
DOI: 10.25365/thesis.48122
URN: urn:nbn:at:at-ubw:1-22769.66352.298253-8

Link zu u:search

Abstract in English

The application of methods originating in artificial intelligence research – and machine learning in particular – to problems in theoretical hemistry offers exciting new possibilities. However, due to the relatively young age of this field and the complexity of the employed models, various difficulties complicate a routine use of these methods. The main goal of this thesis is to develop improved techniques and establish new protocols in order to overcome these limitations. These developments consist of: 1) A new algorithm for training high-dimensional neural network potentials (HDNNPs) – a machine learning technique especially well suited for modeling chemical systems. This training algorithm, termed the element-decoupled Kalman filter, yields HDNNPs of improved accuracy and is also able to incorporate molecular forces into the training process. 2) A HDNNP based fragmentation approach is introduced in order to model extended molecular systems. With this approach, macromolecular properties can be recovered using only the information contained in small fragments of a molecule. 3) These developments are supplemented by an improved adaptive sampling scheme, which identifies molecular configurations required to construct an accurate HDNNP model for a system in a highly automated fashion. 4) A machine learning approach capable of modeling molecular dipole moments is obtained by extending the structure of HDNNPs. The proficiency of all these novel strategies is investigated based on a variety of chemical systems. The performance of the element-decoupled training algorithm is analysed by modeling the Claisen rearrangement reaction of allyl vinyl ether to 4-pentenal. Linear all-trans alkanes serve as a simple test system to assess the HDNNP-based ragmentation approach. A final study is dedicated to the adaptive sampling scheme and the dipole moment model, where these techniques are applied to the molecular dynamics simulation of infrared spectra of methanol, n-alkanes of different lengths and the protonated alanine tripeptide.

Schlagwörter in Englisch

Machine learning / Artificial Inteligence / Theoretical Chemistry / Computational Chemistry

Abstract in German

Strategien aus dem Forschungsbereich der künstlichen Intelligenz und insbesondere dem Gebiet des maschinellen Lernens eröffnen vielversprechende alternative Lösungswege für zahlreiche Probleme aus der theoretischen Chemie. Unglücklicherweise wird eine routinemäßige Anwendung dieser Methoden zur Zeit noch durch zahlreiche Komplikationen erschwert, welche Aufgrund des relativ jungen Alters dieses Forschungsgebietes sowie der hohen Komplexität der verwendeten Modelle auftreten. Das Ziel dieser Arbeit ist es daher, diese Hürden sowohl durch die Verbesserung von vorhandenen als auch die Entwicklung von neuartigen Herangehensweisen zu überwinden. Zu den zu diesem Zwecke eingeführten Neuerungen zählen: 1) Ein verbesserter Algorithmus zum Trainieren von hochdimensionalen neuronalen Netzwerkpotentialen (HDNNPs), ein Ansatz aus dem Bereich des maschinellen Lernens, welcher besonders für die Beschreibung von Molekülen geeignet ist. Die Verwendung dieses Trainingsalgorithmus – des sogenannten „element-decoupled“ Kalman Filters – macht es möglich, hochqualitative HDNNPs zu konstruieren und darüber hinaus auch molekulare Kräfte im Konstruktionsvorgang zu berücksichtigen. 2) Ein Fragmentationsansatz basierend auf HDNNPs wurde einführt, um große Moleküle beschreiben zu können. Mittels dieses Ansatzes können die Eigenschaften großer Moleküle allein anhand kleiner molekularer Fragmente vorhergesagt und so enorme Einsparungen an Rechenzeit erzielt werden. 3) Eine adaptive Selektionsstrategie stellt eine Ergänzung zu den beiden vorherigen Entwicklungen dar und ist in der Lage vollautomatisch jene Molekülgeometrien zu identifizieren, welche notwendig sind um ein chemisch aussagekräftiges HDNNP zu erhalten. 4) Eine Modifizierung der HDNNP Struktur ermöglicht es, ein generelles Modell für die Vorhersage von molekularen Dipolmomenten zu erhalten. Die Brauchbarkeit dieser neu eingeführten Methoden wird anhand einer Reihe von unterschiedlichen chemischen Testsystemen untersucht. Eine Analyse der Leistungsfähigkeit des „element-decoupled“ Kalman Filters erfolgt anhand der Claisen-Umlagerung von Allyl-vinylether zu 4-Pentenal. Lineare Alkanketten dienen der Untersuchung des HDNNP-basierten Fragmentationsansatzes. Eine weitere Studie beschäftigt sich mit der adaptiven Selektionsstrategie und dem Modell zur Vorhersage von Dipolmomenten. Im Rahmen dieser Studie werden die Infrarotspektren von Methanol, n-Alkanen unterschiedlicher Länge sowie des Alanintripeptidkations mittels Moleküldynamik simuliert.

Schlagwörter in Deutsch

Maschinelles Lernen / Künstliche Intelligenz / Theoretische Chemie / Computergestützte Chemie

Item Type: Hochschulschrift (Dissertation)
Author: Gastegger, Michael
Title: Artificial Intelligence in Theoretical Chemistry
Umfangsangabe: iv, 91 Seiten : Illustrationen, Diagramme
Institution: University of Vienna
Faculty: Fakultät für Chemie
Studiumsbezeichnung bzw.
Universitätslehrgang (ULG):
Doktoratsstudium NAWI aus dem Bereich Naturwissenschaften (Dissertationsgebiet: Chemie)
Publication year: 2017
Language: eng ... Englisch
Supervisor: Marquetand, Philipp
Assessor: Oostenbrink, Chris
2. Assessor: Flamm, Christoph
Classification: 35 Chemie > 35.11 Quantenchemie, chemische Bindung
35 Chemie > 35.22 Physikalische Chemie: Sonstiges
35 Chemie > 35.06 Computeranwendungen
54 Informatik > 54.72 Künstliche Intelligenz
AC Number: AC14498514
Item ID: 48122
(Das PDF-Layout ist ident mit der Druckausgabe der Hochschulschrift.)

Urheberrechtshinweis: Für Dokumente, die in elektronischer Form über Datennetze angeboten werden, gilt uneingeschränkt das österreichische Urheberrechtsgesetz; insbesondere sind gemäß § 42 UrhG Kopien und Vervielfältigungen nur zum eigenen und privaten Gebrauch gestattet. Details siehe Gesetzestext.

Edit item (Administrators only) Edit item (Administrators only)