هذه البيانات تفسير مرضية، ولا إعادة تطبيقها أو التوسع فيها. ومن هنا، فسوف يركز الجزء التالي على توضيح تلك المشكلات، ويبين كيف تتعامل معها كل من قاعدة بيانات الأعراق والمؤسسات ومتغير التصويت العرقي.
هل تشير البيانات ومؤشر التوزيع الإثنوجرافي اللغوي إلى"البنية"أم إلى"الممارسة العرقية؟"
هل تحتسب قواعد البيانات الثلاث السابقة الجماعات العرقية التي تعتبر موجودة في أذهان العامة أم الجماعات العرقية التي تستدعي هويتها في ظروف معينة؟ وهل يقيس مؤشر التوزيع الإثنوجرافي اللغوي درجة التنوع العرقي في ضوء الهويات التي تعتبر موجودة في أذهان العامة أم درجة التنوع العرقي في ضوء الهويات التي يتم استدعاؤها؟
المقاربة المعتمدة في أطلس نار ودوف ميرا ليست مذكورة صراحة؛ بينما يشير ألسينا وآخرون (161:2003. Alesina et al) إلى الجماعات العرقية على أنها نتاج"الإصرار على تعريف الهوية"، ومن ثم يدمجون البنية مع الممارسة. أما فيرون (203:2003 Fearon) فعلى العكس من ذلك، يميز تمييز أ صريحة بين الاثنين، ويهدف إلى ترميز البنية العرقية من خلال محاولة رصد الهويات التي تعد واقعة في أذهان العامة - «كيف يقسم الناس في بلد ما الساحة الاجتماعية في أذهانهم تقسيمة عرقية» - وليس الممارسة العرقية، على الأقل في الساحة السياسية. لكن معايير تفعيل هذا التمييز في إجراءات الترميز ليست موجودة وإذا نظرنا إلى البيانات لوجدنا أن كل قواعد البيانات الثلاث تتأرجح دون اتساق بين جمع البيانات عن البنية العرقية والممارسة العرقية.
خذ ألبانيا على سبيل المثال؛ إذ تدرج قواعد البيانات الثلاث الجماعات العرقية في ألبانيا تحت مسميات"ألبانية"و"يونانية"و"مقدونية". لكن لماذا لا تتضمن في حساباتها جماعات عرقية على أساس الديانة (الكاثوليكية والأرثوذوكسية والإسلامية) أو اللهجة (الجيج Gheg المتمركزة في الشمال والتوسك Tosk المتمركزة في الجنوب) ؟ هذه الهويات الأخرى، على ما يبدو، لها وجود في الأذهان. ويبدو أن الفرق الأساسي بين الجماعات