المدونات النصية (Corpus)

  المدونات النصية

ما هي المدونات النصية؟

١. لفظ الجمع منها corpora أو corpuses
٢. مجموعة من النصوص المكتوبة أو المنطوقة
٣. يتم جمعها وتهيئتها إلكترونياً
٤. تستخدم من أجل دراسة اللغة الواقعية المستخدمة بالفعل وليست اللغة المصطنعة
٥. تستخدم من أجل دراسة طبيعة اللغة أي دراسة أنماط أوجه استخدامات اللغة في سياقات مختلفة ومن مصادر متنوعة حتى تصح أن تمثل اللغة الواقعية
٦. تصمم لإجراء البحث اللغوي طبقا لأهداف معينة


* المدونات النصية أساس للدراستين :

برنامج إحصاء تكرار الكلمات (WORD FREQUENCY SOFTWARE)

• عبارة عن برنامج تحليل Corpus في إحصاء الكلمات الذي يسمح بـ :
1 - إحصاء تكرار الكلمات في الفقرات أو الجمل أو المقالة. 
 2 - معرفة موقع الكلمات المعينة من النص أو الفقرات.
3 - معرفة عدد الكلمات المعينة من النص أو الفقرات.
4 - بناء القائمة (word list) للكلمات الشائعة.

برنامج إحصاء الكشافات السياقية (CONCORDANCE SOFTWARE)

• عبارة عن برنامج تحليل Corpus في إحصاء الكلمات الذي يسمح بـ :
1 - إحصاء الكشافات السياقية في الفقرات أو الجمل أو المقالة.
2 - معرفة موقع الكلمات المعينة من النص أو الفقرات.
3 - معرفة كيفية استخدام الكلمات المعينة من النص أو الفقرات. 
4 - بناء المسرد (index) للكلمات المعينة.

من نماذج البرامج على مواقع الويب هو :
1. Sketch Engine
2. Skell
3. Arabicorpus
4. Arabic Concordancer


تعليقات

إرسال تعليق