Open Access. Powered by Scholars. Published by Universities.®

Physical Sciences and Mathematics Commons

Open Access. Powered by Scholars. Published by Universities.®

Articles 1 - 3 of 3

Full-Text Articles in Physical Sciences and Mathematics

Innovationspotenzialanalyse Für Die Neuen Technologien Für Das Verwalten Und Analysieren Von Großen Datenmengen (Big Data Management), Volker Markl, Alexander Löser, Thomas Hoeren, Helmut Krcmar, Holmer Hemsen, Michael Schermann, Matthias Gottlieb, Christoph Buchmüller, Philip Uecker, Till Bitter Nov 2013

Innovationspotenzialanalyse Für Die Neuen Technologien Für Das Verwalten Und Analysieren Von Großen Datenmengen (Big Data Management), Volker Markl, Alexander Löser, Thomas Hoeren, Helmut Krcmar, Holmer Hemsen, Michael Schermann, Matthias Gottlieb, Christoph Buchmüller, Philip Uecker, Till Bitter

Faculty Book Gallery

Durch die Digitalisierung von Wirtschaft und Gesellschaft ist ein rasantes Anwachsen von Datenbeständen zu beobachten. In fast allen Unternehmenssowie Wissenschaftsbereichen werden bereits heute schon Unmengen an Daten erzeugt, deren Größe, Erfassungsgeschwindigkeit oder Heterogenität die Fähigkeiten gängiger Datenbanksoftwareprodukte zur Verwaltung und zur Analyse übersteigt. Dieses Phänomen, welches unter dem Schlagwort „Big Data“ popularisiert wurde, stellt eine große Chance für Unternehmen, Wissenschaft und Gesellschaft dar. Allerdings ergibt sich aufgrund der neuen Komplexität der Daten und Analysen eine Vielzahl an Herausforderungen technischer, wirtschaftlicher und rechtlicher Natur. Diese Studie analysiert die Chancen und Herausforderungen von Big Data insbesondere im Hinblick auf eine nachhaltige Wettbewerbsfä- …


Subsemble: An Ensemble Method For Combining Subset-Specific Algorithm Fits, Stephanie Sapp, Mark J. Van Der Laan, John Canny May 2013

Subsemble: An Ensemble Method For Combining Subset-Specific Algorithm Fits, Stephanie Sapp, Mark J. Van Der Laan, John Canny

U.C. Berkeley Division of Biostatistics Working Paper Series

Ensemble methods using the same underlying algorithm trained on different subsets of observations have recently received increased attention as practical prediction tools for massive datasets. We propose Subsemble: a general subset ensemble prediction method, which can be used for small, moderate, or large datasets. Subsemble partitions the full dataset into subsets of observations, fits a specified underlying algorithm on each subset, and uses a clever form of V-fold cross-validation to output a prediction function that combines the subset-specific fits. We give an oracle result that provides a theoretical performance guarantee for Subsemble. Through simulations, we demonstrate that Subsemble can be …


Automating Large-Scale Simulation Calibration To Real-World Sensor Data, Richard Everett Edwards May 2013

Automating Large-Scale Simulation Calibration To Real-World Sensor Data, Richard Everett Edwards

Doctoral Dissertations

Many key decisions and design policies are made using sophisticated computer simulations. However, these sophisticated computer simulations have several major problems. The two main issues are 1) gaps between the simulation model and the actual structure, and 2) limitations of the modeling engine's capabilities. This dissertation's goal is to address these simulation deficiencies by presenting a general automated process for tuning simulation inputs such that simulation output matches real world measured data. The automated process involves the following key components -- 1) Identify a model that accurately estimates the real world simulation calibration target from measured sensor data; 2) Identify …