Součástí přípravy na provádění testů je mimo jiné příprava testovacích dat. V některých případech může být popis testovacích dat přímou součástí testovacích skriptů, ale většinou je lepší vytvářet testovacích skripty odděleně od testovacích dat. Sady testovacích dat mohou být rozsáhlé a je vhodné je připravovat pohromadě a následně se na ně z testovacích skriptů odkazovat. Testovací data mohou být připravována manuálně, nebo za podpory automatických generátorů dat, které je vhodné využít při vytváření rozsáhlých datových sad.
Automatické generátory dat mají tu výhodu, že jsou schopné ve velmi krátkém čase vytvořit množství dat podle zadaných kritérií a případně je i napumpovat do požadovaného datového zdroje. Další výhodou je, že jsou na rozdíl od lidí neúnavné, neztrácejí pozornost a šetří čas, který by testeři museli jinak strávit nad manuální přípravou dat. Naopak nevhodné jsou tam, kde je zapotřebí vytvořit data pro specifické situace nebo pro určitý cíl, jako je například prověření chování algoritmů v určitých situacích nebo při testování bezpečnosti a konzistence aplikace. V takových případech je pak nutná manuální příprava dat. [Fiurášek, 2010, s. 66-67]
K přípravě testovacích dat lze přistupovat různými způsoby. Příliš se nedoporučuje využívat reálná data, protože mohou být citlivého charakteru nebo pod ochranou zákona. Mnohem lepší způsob je použití upravených reálných dat, kde jsou nahrazeny všechny citlivé a chráněné údaje, ale struktura dat zůstává zachována a mohou být přidána i další data pro pokrytí extrémních situací. Kromě přímého využití nebo úpravy reálných dat, může být zvolen také přístup k přípravě testovacích tzv. na zelené louce. I při tomto přístupu je ovšem vhodné převzít alespoň strukturu dat z databáze obsahující reálná data. [Fiurášek, 2010, s. 65]
Přístup ke generování dat může být statický i dynamický. Při statickém přístupu není zapotřebí běh daného systému či komponenty, kdežto při dynamickém přístupu ano. Nejjednodušším způsobem generování testovacích dat je vygenerování náhodných dat bez ohledu na vnitřní strukturu systému a funkcionalitu zdrojového kódu. Existují ale i sofistikované nástroje, které dokážou automatizovat generování dat dle zvolených technik návrhu testů jako například rozdělení tříd ekvivalencí nebo analýza hraničních hodnot. [Singh, str. 496]
Specializovaných nástrojů pro automatické generování dat je celá škála. K dispozici jsou jak komerční generátory, tak i freeware či open-source generátory. Funkci na automatické generování dat mohou mít zabudovanou i CASE nástroje a nástroje přímo pro datové modelování. Příkladem specializovaných generátorů dat jsou DTM Data Generator, Tnsgen, forSQL Data Generator, Test Data Generator TDG, DB Data Generator, GS Data generátor, MIDOAN. [Fiurášek, s. 66-67]