ذات القيم هي النص الذي يحتوي على الكلمة أو علامة الترقيم الأصلية، والمفهوم الأولي الذي يحتوي على جذر الكلمة مجردة، والحرف الكبير الذي يحتوي على قيمة توضح إذا ما كان الحرف الأول من الرمز في النص الأصلي، أو كل حروفه، يكتب حرفة كبيرة في الإنجليزية]، أو أن جميع حروفه ليست كذلك.
بعد هذه المرحلة من مراحل المعالجة، نرى أن الرمز الذي تم تكوينه لكلمة"روما"
كما ترد في عبارة"روما دمرتها قبائل الهون"Rome was destroyed by the Huns يشتمل على القيم المبينة في الشكل (8 - 1) .
أجزاء الكلام
الخطوة التالية في المعالجة هي تحديد قيم أجزاء الكلام بالاستناد إلى قاعدة بيانات
"وورد نت"WordNet على الموقع الإلكتروني: / http: //wordnet.princeton.edu. هذه القيم سوف تستخدم لاحقا في نظام ترميز أجزاء الكلام؛ لاستكمال تحديد أجزاء الكلام وتسجيلها في الخانة المخصصة لها.
معالجة الرموز
فور الانتهاء من هذه الإجراءات التمهيدية، يشرع برنامج"بروفيلر بلاس"في تطبيق أي قواعد منصوص عليها في نظام الترميز على الجمل وقد تتضمن هذه القواعد أدوات لإنشاء أو تحريك أو حذف بعض الرموز، أو أدوات المقارنة وتغيير قيم الخانات في الرموز، أو أدوات لتوليد الناتج. ولكل قاعدة"مرساة"Anchor، يجب أن تتفق مع قيمة خانة من خانات الرمز حتى تنطبق القاعدة. ويمكن وضع اشتراطات أخرى في جزء"النمط"Pattern في القاعدة، بينما يشتمل جزء"الاختزال"Reduction على التغييرات اللازم إجراؤها أو الناتج المطلوب توليده. ويبين الجدول (1 - 8) مثالا لقاعدة بسيطة التحويل المبني للمعلوم إلى المبني للمجهول لينطبق ما جاء في الجدول على المفردات الإنجليزية، ولذلك تم إبقاء بياناته باللغة ذاتها.