We are proud to announce the winners of our "Microsoft Data Warehouse Toolkit" contest. Erik Bollen was the first one to reply, Tanja Schuddinck gave us the most in-depth definition in dutch. Congratulatoins to both winners and a big thank you to everyone who entered the compettion.
Erik's interpretation:
Junk dimension: A dimension where one can store random transactional
codes, flags and text attributes that are not related to other
dimensions and which provides a simple way for users to easyly find those
unrelated attributes.
Not very original maybe, but you never know...
Tania's definition:
The "junk dimension" (Kimball) also known as "mystery dimension"
(intelligent enterprise) rephrased by Tania Schuddinck:
"A state of mind you achieve after a 2-day course SSIS with Cronos"
Other intelligent definitions:
junk dimension = het verstandig groeperen van (single level hierarchy)
flags en indicators in 1 dimensietabel. Typisch zijn dit flags/indicators
die vallen onder de single level hierarchy: een code en een bijhorende
beschrijving, met als meest eenvoudige voorbeeld een ja/nee-veld.
In een model zonder junk dimensions zullen deze verschillende flags in de
fact table zitten en vaak als foreign key naar elk hun dimensietabel. Om
het aantal foreign keys in een fact table te verminderen, creƫer je dus een
junk dimension tabel met de verschillende combinaties van de flags. 10
verschillende foreignkeys kan je zo vervangen door 1 surrogaat-sleutel die
verwijst naar de junk dimension tabel. Een optie in deze junk dimension
tabel is om niet alle theoretische combinaties te voorzien, maar slechts
degene die in werkelijkheid voorkomen.
Het gebruik van junk dimensions vereenvoudigt het dw-model (minder
dimensietabellen) en komt ten goede aan de query performantie.
Other:
Source: intelligent enterprise: subsystem 15 of 38 subsystems that are
needed in the playgarden of a datawarehouse: Junk dimension builder for
Creation and maintenance of dimensions consisting of miscellaneous low
cardinality flags and indicators found in most production data sources.