Themen des Proseminars “Active Learning”
Artur Andrzejak, Lutz Büch
Wintersemester 2014/2015, Institut für Informatik, Universität Heidelberg
Link zur Seminarseite: http://pvs.ifi.uni-heidelberg.de/teaching/ws2014/ps-active-learning/
Teilnehmer
Vorname | Nachname | Thema | Block | Datum | Vorbesprechung | Ausarb. |
Andreas | Widmann | A1 | A | 23.11. | 14.11., 13:15 |
|
Julian | Gerhard | A2 | A | 23.11. | 13.11., 10:00 |
|
Martin | Enderlein | A3 | A | 23.11. | 18.11., 13:30 |
|
Thomas | Wangler | A4 | A | 23.11. | 18.11., 10:00 |
|
Dominik | Fay | B1 | B | 07.12. | 02.12., 13:00 |
|
Robert | Hajok | B4 | B | 07.12. | 01.12., 10:00 |
|
Paul | Zubrod | B5 | B | 07.12. |
|
|
Oliver | Müller | B7 | B | 07.12. | 01.12., 13:00 |
|
Jonas | Massa | B8 | B | 07.12. | 03.12., 15:00 |
|
Teilnehmer
A. Einführung zu Active Learning
A1 Überwachtes Maschinelles Lernen / Klassifikation
A2 Support vector machines (SVMs), Entscheidungsbäume
A3 Active Learning, Teil I: Einführung
A4 Active Learning, Teil II: Weitere Aspekte
B. Anwendungen von Active Learning
B1 Krebsdiagnose
B2 Stoppkriterien beim Lernen von Named Entity Recognition
B3 Lernen von Parametern für Record Matching
B4 Computergestützte Medikamententdeckung
B5 Software Testing von kommerziellen Spielen
B6 Automatische Spracherkennung
B7 Interaktionsmodelle für das Lernen durch Roboter
B8 Tagging von Musik als online-Spiel
B9 Automatische Experimente durch einen Wissenschaftsroboter
A. Einführung zu Active Learning
Allgemeine Literatur:
- Settles, Burr. "Active learning." Synthesis Lectures on Artificial Intelligence and Machine Learning 6.1 (2012): 1-114. link
- Gertz, Michael. “Knowledge Discovery in Databases” Slides from lecture in WS 13/14 link
A1 Überwachtes Maschinelles Lernen / Klassifikation
- Was ist Machine Learning?
- Was ist überwachtes Lernen? Was ist Klassifikation?
- Was ist Training, was Test? Wozu braucht man beides?
- Separierbarkeit: Kann mein Modell die gesehenen Daten perfekt trennen?
- Entscheidungsbäume, C4.5
- Konstruktion, Split-Kriterien
- Separierbarkeit bei Entscheidungsbäumen
- Pruning gegen Overfitting
- Overfitting: Sollte mein Modell die gesehenen Daten so gut wie möglich trennen?
- Wie misst man die Güte eines Klassifikationsmodells?
- Ideale Voraussetzung: KDD
A2 Support vector machines (SVMs)
- Support Vector machines (SVMs)
- Cristianini, Nello, and John Shawe-Taylor. An introduction to support vector machines and other kernel-based learning methods. Cambridge university press, 2000. UB
- Schohn, Greg, and David Cohn. "Less is more: Active learning with support vector machines." ICML. 2000. link
- Beschreibung des Modells
- Berechnung / Lernen
- Separierbarkeit bei SVMs
- Soft Margin
- Kernel, Feature Space
- Ideale Voraussetzung: KDD
A3 Active Learning, Teil I: Einführung
- Lernen eines Modells
- Klassifizieren / vorhersagen
- Anfrage (query) machen (pool-basiert)
- Uncertainty sampling: Active learning, Kapitel 2.1, 2.2, 2.3
- Version space reduction:
- Query by disagreement (QBD)
- Query by committee (QBC)
A4 Active Learning, Teil II: Weitere Aspekte
- Initialisierung, “cold start problem”
- Attenberg, Josh, and Foster Provost. "Inactive learning?: difficulties employing active learning in practice." ACM SIGKDD Explorations Newsletter 12.2 (2011): 36-41. link, Section 6
- query-Synthese
- stream-basiert
- Vorteile und Nachteile
- Anforderung für query-Synthese
- Wann kann man query-Synthese sinnvoll einsetzen?
- Wann kann query-Synthese unsinnvolle Ergebnisse liefern?
B. Anwendungen von Active Learning
B1 Krebsdiagnose
- Liu, Ying. "Active learning with support vector machine applied to gene expression data for cancer classification." Journal of chemical information and computer sciences 44.6 (2004): 1936-1941. link
B2 Stoppkriterien beim Lernen von Named Entity Recognition
- Laws, Florian, and Hinrich Schätze. "Stopping criteria for active learning of named entity recognition." Proceedings of the 22nd International Conference on Computational Linguistics-Volume 1. Association for Computational Linguistics, 2008. link
B3 Lernen von Parametern für Record Matching
B4 Computergestützte Medikamententdeckung
- Warmuth, Manfred K., et al. "Active learning with support vector machines in the drug discovery process." Journal of Chemical Information and Computer Sciences 43.2 (2003): 667-673. link
B5 Software Testing von kommerziellen Spielen
- Xiao, Gang, et al. "Software testing by active learning for commercial games." Proceedings of the National Conference on Artificial Intelligence. Vol. 20. No. 2. Menlo Park, CA; Cambridge, MA; London; AAAI Press; MIT Press; 1999, 2005. link
B6 Automatische Spracherkennung
- Riccardi, Giuseppe, and Dilek Hakkani-Tur. "Active learning: Theory and applications to automatic speech recognition." Speech and Audio Processing, IEEE Transactions on 13.4 (2005): 504-511. link
B7 Interaktionsmodelle für das Lernen durch Roboter
- Cakmak, Maya, Crystal Chao, and Andrea L. Thomaz. "Designing interactions for robot active learners." Autonomous Mental Development, IEEE Transactions on 2.2 (2010): 108-118. link
- M. Cakmak and A.L. Thomaz. “Mixed-Initiative Active Learning”. International Conference on Machine Learning - Workshop on Combining Learning Strategies to Reduce Label Cost, 2011. link
- Was ist der konzeptionelle Unterschied zwischen Learning und Teaching?
- Welche Vor- und Nachteile ergeben sich aus Teaching im Vergleich zu Learning?
B8 Tagging von Musik als online-Spiel
- Barrington, Luke, Douglas Turnbull, and Gert Lanckriet. "Game-powered machine learning." Proceedings of the National Academy of Sciences 109.17 (2012): 6411-6416. link
- crowdsourcing
B9 Automatische Experimente durch einen Wissenschaftsroboter
- King, Ross D., et al. "Functional genomic hypothesis generation and experimentation by a robot scientist." Nature 427.6971 (2004): 247-252. link