للتفاوتات غير الملائمة والكليات الغامضة التي لا يجوز إدراجها (فمثلا كلمة pleasant أي سار أو مبهج ربما تعد بعيدة جدا عن الجذر الأصلي) . وبعض البرامج الحاسوبية التحليل النصوص والبرامج المعاونة المرتبطة بها تتضمن إمكانات بناء المعاجم. فمثلا، نجد أن برنامج Wordstat مصمم بحيث يسمح بإضافة المرادف والمقابل والمشابه والاسم الشامل والاسم المشمول واسم الكل وأصناف أخرى عديدة من الكلمات إلى المعجم الأصلي. كما يسمح برنامج Wordstat، وبعض البرامج الأخرى، بوضع مواصفات للتنبؤ بالكلمات الجذرية (فمثلا، إدخال"* pleasur"يؤدي إلى استخراج كل الكلمات البادئة بهذه الحروف"pleasur") . ولكن على الباحث أن يتدخل عن كثب لاتخاذ القرار في إدراج أو استبعاد أي مصطلح، فليس هناك أي شيء تلقائي في عملية بناء المعجم.
الترميز بالحاسوب حسب الحالة
هذا النوع من الترميز أقل قبولا بين محللي المضمون؛ لأنه يحيد عن الافتراضات الوضعية المسلم بها والمقبولة في منهج تحليل المضمون. ففي نظام"الترميز حسب الحالة"تشتق أبعاد النص أو أنماطه من البيانات موضع الدراسة (أي النصوص المبحوثة) من دون استعمال أي معجم موضوع سلفا (7) . وهناك مجموعة من البرامج مثل CATPAC و TextSmart و TextAnalyst صممت لتسمح بالتعبير البصري عن معدل الظهور، والظهور المتناظر، و/ أو توافق الكلمات أو المقاطع النصية من خلال تحليل التجميعات والقياس متعدد المستويات والربط العصبي. وإننا نشير هنا إلى هذا الخيار غير التقليدي السببين؛ أولهما، أن التطورات الحادثة في مجال تحليل مضمون النصوص بالحاسوب جعلت بعض التقنيات الجديدة أكثر موضوعية وقابلية لإعادة التطبيق. وثانيهما، أنا والآخرين ما نفتأ نكتشف أن التقنيات الجديدة أدوات مفيدة في المراحل المبكرة من أي مشروع لتحليل المضمون. أي أن الأبعاد المشتقة من نظم الترميز الجديدة يمكن استخدامها من مرحلة ثانية في عملية الترميز العادية المجهزة سلفا.