Heute werde ich Ihnen zwei der am häufigsten verwendeten Begriffe beim maschinellen Lernen vorstellen. Beim maschinellen Lernen haben wir es mit vielen Daten zu tun und es ist wichtig, die Namenskonventionen in Bezug auf Datensätze zu kennen, nämlich Variablen und Beobachtungen.

Definieren des Datensatzes

Vor der Beantwortung der Frage, was Variablen und Beobachtungen sind, sollten wir zunächst einen Datensatz kennenlernen. Was ist ein Datensatz? Ein Datensatz ist eine Sammlung von Datenwerten in einem Matrixformat. Lassen Sie sich nicht von der Definition verwirren. In einfachen Worten, der Datensatz ist eine Sammlung von Werten in Zeilen und Spalten. Zum Beispiel:

 Spalte 1Spalte 2
Reihe 1Artikel 1×1Artikel 1×2
Reihe 2Artikel 2×1Artikel 2×2

Dies ist eine Matrix der Dimension 2×2 mit 2 Spalten und 2 Zeilen. Dabei sind Element 1×1, Element 1×2, Element 2×1 und Element 2×2 die Datenelemente.

Was sind Variablen und Beobachtungen in einem Datensatz? - Machine Learning Zukunft
Was sind Variablen und Beobachtungen in einem Datensatz? – Machine Learning Zukunft

Real Life Beispiel für Variable und Beobachtungen

Wir können jede Art von Datensatz mit dem obigen Rahmenwerk darstellen. Schauen wir uns den Datensatz von Sundar und Nicki an:

GeschlechtAlterLand
Männlich45Indien
Weiblich47US

Was sind Variablen und Beobachtungen im obigen Datensatz? Name, Alter und Land sind Variablen (Spalten). Die Datenelemente (Männlich, 45, Indien, Weiblich, 47, und USA) sind Beobachtungen (Zeilen).

Moment mal! Warum nenne ich die als Variablen und Beobachtungen?

Im Grunde genommen sind Sundar und Nicki zwei Objekte, die einige Merkmale haben. Hier sind die Merkmale Geschlecht, Alter und Land. Diese Merkmale sind variabler Natur. Zum Beispiel: Das Alter kann einen beliebigen realen Wert haben und variiert von Person zu Person. Daher der Name Variable. Wenn in einem Experiment Objekte ihre Eigenschaften und Werte offenbaren, die sie ausmachen. Daher können Variablen als Eigenschaften eines Objekts definiert werden und Beobachtungen sind die Werte. Hier sind Sundar und Nicki zwei Objekte.

Abhängig von der Anzahl der Variablen im Datensatz werden die Datensätze also als ein- oder mehrvariabel kategorisiert. Ein einvariabler Datensatz hat nur eine Spalte (Variable) und ein mehrvariabler Datensatz hat mehr als eine Spalte von Daten.

Daher haben wir mit Hilfe der obigen Erklärung und Beispiele erfahren, was Variablen und Beobachtungen sind.