Die Datenmengen und Zusammensetzungen hängen sehr stark von der zugrundeliegenden Fragestellung ab. Wichtig ist, stets für den Zweck erhobene Daten zu verwenden, weil sich nur Informationen finden lassen, wenn sie auch in den Daten enthalten sind. Darauf aufbauend muss auf Redundanz verzichtet werden, da dadurch keine neuen Erkenntnisse entstehen. Des Weiteren sollte Wert auf saubere Daten gelegt werden, da diese keine störenden Überraschungen beinhalten und dementsprechend die Werte der Feldbeschreibungen sinnvoll definiert sind. Und die Bezüge zwischen den Daten sollten klar erkennbar sein, um einen Zusammenhang zu Eingangs- und Zielvariablen herzustellen.