Session: Chemometrical Methods - An Option for Data Mining from Analytical Data Sets

Session Chair: Dr. Jörg Kraft, Dr. Tobias Eifert
English

Retrospektive Prüfung der Probennahmeunsicherheit anhand von analytischen Ergebnissen mittels chemometrischer Methoden

Wolf von Tümpling, Helmholtz-Zentrum für Umweltforschung - UFZ
Jeder Nutzer von analytischen Ergebnissen fordert für diese eine vorab definierte Richtigkeit und Präzision also in Summe Genauigkeit. Neben dem adäquaten analytischen Arbeiten u. a. nach DIN 38402-60 (Analytische Qualitätssicherung für die chemische und physikalisch-chemische Wasseruntersuchung (A 60)) im Labor kommt deshalb einer für die Fragestellung akzeptablen Probennahmeunsicherheit eine besondere Bedeutung zu. Nicht zuletzt aus diesem Grunde existieren eine Reihe von Normen und Vorschriften zur Probenahme, die auf entsprechenden Erkenntnissen und praktischen Erfahrungen und Voruntersuchungen basieren. Als problematisch ist die Tatsache anzusehen, dass während der eigentlichen Probenahme bzw. vor den analytischen Messungen die Probennahmeunsicherheit mit Bezug zu den zu untersuchenden Parametern kaum überprüft werden kann. Oftmals nur durch vor Ort bestimmte Parameter werden Inhomogenitäten und Variabilitäten nachgewiesen bzw. ausgeschlossen und bilden häufig die Grundlage für die Annahme einer akzeptablen Probennahmeunsicherheit. Mit Bezug zu den im Labor zu untersuchenden Parametern, fehlen diese Kenntnisse in der Regel. In Ergänzung u. a. zur EN ISO 5667-1:2006 (A4) (Wasserbeschaffenheit - Probenahme) und der DIN 38402 (Allgemeine Angaben) kann durch eine gezielte chemometrische Aus- und Bewertung der analytischen Ergebnisse untersuchter Parameter auch retrospektiv in vielen Fällen der Grad der Probennahmeunsicherheit detaillierter ermittelt werden. Redundanzen bzw. auch die nicht akzeptable Unsicherheit mit Bezug zu den Analysenergebnissen können so nachgewiesen werden. Im Rahmen des Vortrages werden dem Nutzer analytischer Daten statistische Testverfahren und Methoden vorgestellt, retrospektiv Aussagen über sich ergebende oder auch nicht vorhandene Unsicherheiten von untersuchten Parametern mit Bezug zur Probennahme (Probenanzahl bzw. Probenauswahl) zu erhalten.
English

Retrospektive Prüfung der Probennahmeunsicherheit anhand von analytischen Ergebnissen mittels chemometrischer Methoden

Wolf von Tümpling, Helmholtz-Zentrum für Umweltforschung - UFZ
Jeder Nutzer von analytischen Ergebnissen fordert für diese eine vorab definierte Richtigkeit und Präzision also in Summe Genauigkeit. Neben dem adäquaten analytischen Arbeiten u. a. nach DIN 38402-60 (Analytische Qualitätssicherung für die chemische und physikalisch-chemische Wasseruntersuchung (A 60)) im Labor kommt deshalb einer für die Fragestellung akzeptablen Probennahmeunsicherheit eine besondere Bedeutung zu. Nicht zuletzt aus diesem Grunde existieren eine Reihe von Normen und Vorschriften zur Probenahme, die auf entsprechenden Erkenntnissen und praktischen Erfahrungen und Voruntersuchungen basieren. Als problematisch ist die Tatsache anzusehen, dass während der eigentlichen Probenahme bzw. vor den analytischen Messungen die Probennahmeunsicherheit mit Bezug zu den zu untersuchenden Parametern kaum überprüft werden kann. Oftmals nur durch vor Ort bestimmte Parameter werden Inhomogenitäten und Variabilitäten nachgewiesen bzw. ausgeschlossen und bilden häufig die Grundlage für die Annahme einer akzeptablen Probennahmeunsicherheit. Mit Bezug zu den im Labor zu untersuchenden Parametern, fehlen diese Kenntnisse in der Regel. In Ergänzung u. a. zur EN ISO 5667-1:2006 (A4) (Wasserbeschaffenheit - Probenahme) und der DIN 38402 (Allgemeine Angaben) kann durch eine gezielte chemometrische Aus- und Bewertung der analytischen Ergebnisse untersuchter Parameter auch retrospektiv in vielen Fällen der Grad der Probennahmeunsicherheit detaillierter ermittelt werden. Redundanzen bzw. auch die nicht akzeptable Unsicherheit mit Bezug zu den Analysenergebnissen können so nachgewiesen werden. Im Rahmen des Vortrages werden dem Nutzer analytischer Daten statistische Testverfahren und Methoden vorgestellt, retrospektiv Aussagen über sich ergebende oder auch nicht vorhandene Unsicherheiten von untersuchten Parametern mit Bezug zur Probennahme (Probenanzahl bzw. Probenauswahl) zu erhalten.
English

Retrospektive Prüfung der Probennahmeunsicherheit anhand von analytischen Ergebnissen mittels chemometrischer Methoden

Wolf von Tümpling, Helmholtz-Zentrum für Umweltforschung - UFZ
Jeder Nutzer von analytischen Ergebnissen fordert für diese eine vorab definierte Richtigkeit und Präzision also in Summe Genauigkeit. Neben dem adäquaten analytischen Arbeiten u. a. nach DIN 38402-60 (Analytische Qualitätssicherung für die chemische und physikalisch-chemische Wasseruntersuchung (A 60)) im Labor kommt deshalb einer für die Fragestellung akzeptablen Probennahmeunsicherheit eine besondere Bedeutung zu. Nicht zuletzt aus diesem Grunde existieren eine Reihe von Normen und Vorschriften zur Probenahme, die auf entsprechenden Erkenntnissen und praktischen Erfahrungen und Voruntersuchungen basieren. Als problematisch ist die Tatsache anzusehen, dass während der eigentlichen Probenahme bzw. vor den analytischen Messungen die Probennahmeunsicherheit mit Bezug zu den zu untersuchenden Parametern kaum überprüft werden kann. Oftmals nur durch vor Ort bestimmte Parameter werden Inhomogenitäten und Variabilitäten nachgewiesen bzw. ausgeschlossen und bilden häufig die Grundlage für die Annahme einer akzeptablen Probennahmeunsicherheit. Mit Bezug zu den im Labor zu untersuchenden Parametern, fehlen diese Kenntnisse in der Regel. In Ergänzung u. a. zur EN ISO 5667-1:2006 (A4) (Wasserbeschaffenheit - Probenahme) und der DIN 38402 (Allgemeine Angaben) kann durch eine gezielte chemometrische Aus- und Bewertung der analytischen Ergebnisse untersuchter Parameter auch retrospektiv in vielen Fällen der Grad der Probennahmeunsicherheit detaillierter ermittelt werden. Redundanzen bzw. auch die nicht akzeptable Unsicherheit mit Bezug zu den Analysenergebnissen können so nachgewiesen werden. Im Rahmen des Vortrages werden dem Nutzer analytischer Daten statistische Testverfahren und Methoden vorgestellt, retrospektiv Aussagen über sich ergebende oder auch nicht vorhandene Unsicherheiten von untersuchten Parametern mit Bezug zur Probennahme (Probenanzahl bzw. Probenauswahl) zu erhalten.
English

Multivariate Approaches in the Evaluation of (Hyper)Spectral Data for Microplastics Analysis – Options and Limitations

Andrea Paul, Bundesanstalt für Materialforschung und –prüfung (BAM)
Die zunehmende Anreicherung von Gewässern und Böden mit Plastikmüll führt zur Anhäufung von mikroskopisch kleinen Plastikpartikeln, sogenannter Mikroplastik (MP). Es werden dringend analytische Methoden benötigt, die helfen MP zu identifizieren und zu quantifizieren. Gegenwärtig kommen dafür hauptsächlich thermoanalytische und mikroskopische Verfahren, wie Mikro-Infrarotspektroskopie oder Mikro-Raman zum Einsatz. Letztere sind in der Regel an zeitaufwendige Probenanreicherungen und aufbereitungen gebunden, es können nur kleine Probenmengen (Mikrogramm) untersucht werden und die Auswertung der erzielten Spektren kann anspruchsvoll sein. Im Rahmen dieser Präsentation werden zwei Ansätze vorgestellt, die über die multivariate Analyse spektroskopischer Daten i) einen neuen methodischen Ansatz zum Screening von MP in belasteten Böden sowie ii) eine alternative Auswertung großer (Mikro)-spektroskopischer Datensätze ermöglichen. Zunächst wird ein NIR-spektroskopisches Verfahrens vorgestellt, das es gestattet MP bestehend aus Polyethylen, Polyethylenterephthalat, Polypropylen und Polystyrol im Bereich bis zu 0,5 Massenprozent zu detektieren [1]. Aufgrund kurzer Messzeiten und robuster Technik besitzt dieser Ansatz das Potenzial, im Gegensatz zu den thermoanalytischen und mikrospektroskopischen Methoden, größere Probenmengen mit minimaler Vorbehandlung zu untersuchen. Der zweite Ansatz befasst sich mit der Auswertung großen Datensätze, wie sie typischerweise als Resultat der Mikro-FTIR unter Nutzung moderner FPA-Detektoren erhalten werden. Die Mikro-FTIR-Technik beruht auf der spektralen Aufnahme, Abbildung und anschließenden Identifizierung von Schwingungsbanden, die für synthetische Polymere typisch sind. Die Bilddatensätze sind groß und enthalten Spektren von unzähligen Partikeln natürlichen und synthetischen Ursprungs. Zur Ergänzung bestehender Ansätze, die z.B. auf Recherchen von Spektrenbibliotheken basieren, wurde die explorative multivariate Datenanalyse getestet. Als Kernkonzept wurde hierbei die Dimensionalitätsreduktion verwendet. Die Ergebnisse stellen nicht nur eine orthogonale Methode zur Kontrolle der Ergebnisse dar, die auf Grundlage einer automatisierten Bibliothekssuche erzielt wurden, sondern ergaben darüber hinaus eine Gruppe von Spektren, die nicht in den vorhandenen Spektrenbibliotheken erfasst wurden [2].
English

Multivariate Approaches in the Evaluation of (Hyper)Spectral Data for Microplastics Analysis – Options and Limitations

Andrea Paul, Bundesanstalt für Materialforschung und –prüfung (BAM)
Die zunehmende Anreicherung von Gewässern und Böden mit Plastikmüll führt zur Anhäufung von mikroskopisch kleinen Plastikpartikeln, sogenannter Mikroplastik (MP). Es werden dringend analytische Methoden benötigt, die helfen MP zu identifizieren und zu quantifizieren. Gegenwärtig kommen dafür hauptsächlich thermoanalytische und mikroskopische Verfahren, wie Mikro-Infrarotspektroskopie oder Mikro-Raman zum Einsatz. Letztere sind in der Regel an zeitaufwendige Probenanreicherungen und aufbereitungen gebunden, es können nur kleine Probenmengen (Mikrogramm) untersucht werden und die Auswertung der erzielten Spektren kann anspruchsvoll sein. Im Rahmen dieser Präsentation werden zwei Ansätze vorgestellt, die über die multivariate Analyse spektroskopischer Daten i) einen neuen methodischen Ansatz zum Screening von MP in belasteten Böden sowie ii) eine alternative Auswertung großer (Mikro)-spektroskopischer Datensätze ermöglichen. Zunächst wird ein NIR-spektroskopisches Verfahrens vorgestellt, das es gestattet MP bestehend aus Polyethylen, Polyethylenterephthalat, Polypropylen und Polystyrol im Bereich bis zu 0,5 Massenprozent zu detektieren [1]. Aufgrund kurzer Messzeiten und robuster Technik besitzt dieser Ansatz das Potenzial, im Gegensatz zu den thermoanalytischen und mikrospektroskopischen Methoden, größere Probenmengen mit minimaler Vorbehandlung zu untersuchen. Der zweite Ansatz befasst sich mit der Auswertung großen Datensätze, wie sie typischerweise als Resultat der Mikro-FTIR unter Nutzung moderner FPA-Detektoren erhalten werden. Die Mikro-FTIR-Technik beruht auf der spektralen Aufnahme, Abbildung und anschließenden Identifizierung von Schwingungsbanden, die für synthetische Polymere typisch sind. Die Bilddatensätze sind groß und enthalten Spektren von unzähligen Partikeln natürlichen und synthetischen Ursprungs. Zur Ergänzung bestehender Ansätze, die z.B. auf Recherchen von Spektrenbibliotheken basieren, wurde die explorative multivariate Datenanalyse getestet. Als Kernkonzept wurde hierbei die Dimensionalitätsreduktion verwendet. Die Ergebnisse stellen nicht nur eine orthogonale Methode zur Kontrolle der Ergebnisse dar, die auf Grundlage einer automatisierten Bibliothekssuche erzielt wurden, sondern ergaben darüber hinaus eine Gruppe von Spektren, die nicht in den vorhandenen Spektrenbibliotheken erfasst wurden [2].
English

Multivariate Approaches in the Evaluation of (Hyper)Spectral Data for Microplastics Analysis – Options and Limitations

Andrea Paul, Bundesanstalt für Materialforschung und –prüfung (BAM)
Die zunehmende Anreicherung von Gewässern und Böden mit Plastikmüll führt zur Anhäufung von mikroskopisch kleinen Plastikpartikeln, sogenannter Mikroplastik (MP). Es werden dringend analytische Methoden benötigt, die helfen MP zu identifizieren und zu quantifizieren. Gegenwärtig kommen dafür hauptsächlich thermoanalytische und mikroskopische Verfahren, wie Mikro-Infrarotspektroskopie oder Mikro-Raman zum Einsatz. Letztere sind in der Regel an zeitaufwendige Probenanreicherungen und aufbereitungen gebunden, es können nur kleine Probenmengen (Mikrogramm) untersucht werden und die Auswertung der erzielten Spektren kann anspruchsvoll sein. Im Rahmen dieser Präsentation werden zwei Ansätze vorgestellt, die über die multivariate Analyse spektroskopischer Daten i) einen neuen methodischen Ansatz zum Screening von MP in belasteten Böden sowie ii) eine alternative Auswertung großer (Mikro)-spektroskopischer Datensätze ermöglichen. Zunächst wird ein NIR-spektroskopisches Verfahrens vorgestellt, das es gestattet MP bestehend aus Polyethylen, Polyethylenterephthalat, Polypropylen und Polystyrol im Bereich bis zu 0,5 Massenprozent zu detektieren [1]. Aufgrund kurzer Messzeiten und robuster Technik besitzt dieser Ansatz das Potenzial, im Gegensatz zu den thermoanalytischen und mikrospektroskopischen Methoden, größere Probenmengen mit minimaler Vorbehandlung zu untersuchen. Der zweite Ansatz befasst sich mit der Auswertung großen Datensätze, wie sie typischerweise als Resultat der Mikro-FTIR unter Nutzung moderner FPA-Detektoren erhalten werden. Die Mikro-FTIR-Technik beruht auf der spektralen Aufnahme, Abbildung und anschließenden Identifizierung von Schwingungsbanden, die für synthetische Polymere typisch sind. Die Bilddatensätze sind groß und enthalten Spektren von unzähligen Partikeln natürlichen und synthetischen Ursprungs. Zur Ergänzung bestehender Ansätze, die z.B. auf Recherchen von Spektrenbibliotheken basieren, wurde die explorative multivariate Datenanalyse getestet. Als Kernkonzept wurde hierbei die Dimensionalitätsreduktion verwendet. Die Ergebnisse stellen nicht nur eine orthogonale Methode zur Kontrolle der Ergebnisse dar, die auf Grundlage einer automatisierten Bibliothekssuche erzielt wurden, sondern ergaben darüber hinaus eine Gruppe von Spektren, die nicht in den vorhandenen Spektrenbibliotheken erfasst wurden [2].
English

Where does all that noise come from? Confounders and Uncertainty along the Analytical Process

Claudia Beleites, Chemometrix GmbH
In der chemischen Analytik bewirken oft mehrere Störfaktoren Rauschen (zufällige Unsicherheit) auf dem Analysenergebnis. Als grober Richtwert gilt, dass der größte Teil des experimentellen Aufwands dem größten Störfaktor gewidmet werden sollte. Dazu muss die Größe der einzelnen Stör- oder Einflussfaktoren zumindest ungefähr bekannt sein. In der chemischen Analytik sind tief geschachtelte Zusammenhänge zwischen den Störfaktoren häufig, die das Messen der einzelnen Störfaktoren erschweren. Wir stellen Versuchspläne (experimentelle Designs) vor, die solche geschachtelten Störgrößen abschätzen, ohne dass der experimentelle Aufwand mit der Anzahl der Störgrößen exponentiell wachsen muss. Diese gestaffelten und invertierten geschachtelten Versuchspläne an sich sind seit den 1960er Jahren bekannt [1] – inzwischen können sie auch ausgewertet werden. Als praktisches Beispiel stellen wir Proben- und Versuchspläne für die chemische Referenzanalytik bei Kakaofermentationen vor. Wir schätzen die biologische Variabilität im Analytgehalt ab und überwachen Zufallsfehler entlang des Analysengangs. Wir bedanken uns bei AIF und FEI für die Finanzierung des Projekts “CococaChain” am Julius Kühn-Institut (IGF 169 EN/3) und der Universität Hamburg (IGF 169 EN/1).
English

Where does all that noise come from? Confounders and Uncertainty along the Analytical Process

Claudia Beleites, Chemometrix GmbH
In der chemischen Analytik bewirken oft mehrere Störfaktoren Rauschen (zufällige Unsicherheit) auf dem Analysenergebnis. Als grober Richtwert gilt, dass der größte Teil des experimentellen Aufwands dem größten Störfaktor gewidmet werden sollte. Dazu muss die Größe der einzelnen Stör- oder Einflussfaktoren zumindest ungefähr bekannt sein. In der chemischen Analytik sind tief geschachtelte Zusammenhänge zwischen den Störfaktoren häufig, die das Messen der einzelnen Störfaktoren erschweren. Wir stellen Versuchspläne (experimentelle Designs) vor, die solche geschachtelten Störgrößen abschätzen, ohne dass der experimentelle Aufwand mit der Anzahl der Störgrößen exponentiell wachsen muss. Diese gestaffelten und invertierten geschachtelten Versuchspläne an sich sind seit den 1960er Jahren bekannt [1] – inzwischen können sie auch ausgewertet werden. Als praktisches Beispiel stellen wir Proben- und Versuchspläne für die chemische Referenzanalytik bei Kakaofermentationen vor. Wir schätzen die biologische Variabilität im Analytgehalt ab und überwachen Zufallsfehler entlang des Analysengangs. Wir bedanken uns bei AIF und FEI für die Finanzierung des Projekts “CococaChain” am Julius Kühn-Institut (IGF 169 EN/3) und der Universität Hamburg (IGF 169 EN/1).
English

Where does all that noise come from? Confounders and Uncertainty along the Analytical Process

Claudia Beleites, Chemometrix GmbH
In der chemischen Analytik bewirken oft mehrere Störfaktoren Rauschen (zufällige Unsicherheit) auf dem Analysenergebnis. Als grober Richtwert gilt, dass der größte Teil des experimentellen Aufwands dem größten Störfaktor gewidmet werden sollte. Dazu muss die Größe der einzelnen Stör- oder Einflussfaktoren zumindest ungefähr bekannt sein. In der chemischen Analytik sind tief geschachtelte Zusammenhänge zwischen den Störfaktoren häufig, die das Messen der einzelnen Störfaktoren erschweren. Wir stellen Versuchspläne (experimentelle Designs) vor, die solche geschachtelten Störgrößen abschätzen, ohne dass der experimentelle Aufwand mit der Anzahl der Störgrößen exponentiell wachsen muss. Diese gestaffelten und invertierten geschachtelten Versuchspläne an sich sind seit den 1960er Jahren bekannt [1] – inzwischen können sie auch ausgewertet werden. Als praktisches Beispiel stellen wir Proben- und Versuchspläne für die chemische Referenzanalytik bei Kakaofermentationen vor. Wir schätzen die biologische Variabilität im Analytgehalt ab und überwachen Zufallsfehler entlang des Analysengangs. Wir bedanken uns bei AIF und FEI für die Finanzierung des Projekts “CococaChain” am Julius Kühn-Institut (IGF 169 EN/3) und der Universität Hamburg (IGF 169 EN/1).
English

Chemometrics for Process Spectroscopy

Geir Rune Flåten, CAMO Analytics
The use of spectroscopic techniques for on-line purposes has a long history in industry. Typical applications are found within downstream operations in oil & gas, polymer production, agriculture and food & feed. The instruments are implemented on-line, atline or mounted on vehicles, satellites, planes or drones. Most pharma and biopharma companies are also utilizing spectroscopy within the Process Analytical Technology framework where also Quality by Deign plays an important role in product development and process optimization. The applications range from raw material identification, MSPC, monitoring batch processes and prediction. Depending on the type of process and material, various spectroscopic techniques may be used: UV, Visible, FT-IR, NIR, Raman and NMR. Lately also imaging spectroscopy has gained more attention. This presentation will focus on the following aspects: • The multivariate advantage in process monitoring • Spectral preprocessing • Conservative model validation • Data alignment, e.g. sensor fusion with univariate sensors • Interactive drill-down for outlier detection • Model maintenance Selected real-life applications will be shown.
English

Chemometrics for Process Spectroscopy

Geir Rune Flåten, CAMO Analytics
The use of spectroscopic techniques for on-line purposes has a long history in industry. Typical applications are found within downstream operations in oil & gas, polymer production, agriculture and food & feed. The instruments are implemented on-line, atline or mounted on vehicles, satellites, planes or drones. Most pharma and biopharma companies are also utilizing spectroscopy within the Process Analytical Technology framework where also Quality by Deign plays an important role in product development and process optimization. The applications range from raw material identification, MSPC, monitoring batch processes and prediction. Depending on the type of process and material, various spectroscopic techniques may be used: UV, Visible, FT-IR, NIR, Raman and NMR. Lately also imaging spectroscopy has gained more attention. This presentation will focus on the following aspects: • The multivariate advantage in process monitoring • Spectral preprocessing • Conservative model validation • Data alignment, e.g. sensor fusion with univariate sensors • Interactive drill-down for outlier detection • Model maintenance Selected real-life applications will be shown.
English

Chemometrics for Process Spectroscopy

Geir Rune Flåten, CAMO Analytics
The use of spectroscopic techniques for on-line purposes has a long history in industry. Typical applications are found within downstream operations in oil & gas, polymer production, agriculture and food & feed. The instruments are implemented on-line, atline or mounted on vehicles, satellites, planes or drones. Most pharma and biopharma companies are also utilizing spectroscopy within the Process Analytical Technology framework where also Quality by Deign plays an important role in product development and process optimization. The applications range from raw material identification, MSPC, monitoring batch processes and prediction. Depending on the type of process and material, various spectroscopic techniques may be used: UV, Visible, FT-IR, NIR, Raman and NMR. Lately also imaging spectroscopy has gained more attention. This presentation will focus on the following aspects: • The multivariate advantage in process monitoring • Spectral preprocessing • Conservative model validation • Data alignment, e.g. sensor fusion with univariate sensors • Interactive drill-down for outlier detection • Model maintenance Selected real-life applications will be shown.