إصلاح انحناء وتقوس الكتابة في صور الوثاق العربية...

28
1 ة ب ا ت ك ل وس ا ق ت اء و ن ح ن ا لاح ص ا ة م ي د ق ل ا ة ي# ب ر لع ا اق* وث ل ور ا ص ي ف ي م ي ل ع لدل ا مد عا ح م لاعة ص و ب اء – وف ي ف ر* ش ل ا ف ص ن م ة ي ك الد ات ت لL لا ل* ث ح ب ل ا وحدةRE search G roup on I ntelligent M achine (REGIM) س ق ا ق ص عة م ا حUU- و ل ا مدرسة ل ا ن ط س ق ا ق ص ب\ ن سي د ت ه م ل ل ة ي س ن و ب ة ي# ب ر لع ا ة ع ل ل ا ث وت س حا ل وم ا ل ع مارسة م ل ع ب را ل ا ي م ل عا ل ر ا م يq و م ل ا ر ط ق الدوحة، 1 - 4 ل ي ر فq ا2008

description

إصلاح انحناء وتقوس الكتابة في صور الوثاق العربية القديمة منصف الشرفي – وفاء بوصلاعة – محمد عادل العليمي وحدة البحث للآليات الذكية RE search G roup on I ntelligent M achine ( REGIM ) جامعة صفاقس - المدرسة الو طن ية للمهندسين بصفاقس – تونس - PowerPoint PPT Presentation

Transcript of إصلاح انحناء وتقوس الكتابة في صور الوثاق العربية...

Page 1: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

1

الكتابة وتقوس انحناء إصالحالعربية الوثاق صور في

القديمة منصف الشرفي – وفاء بوصالعة – محمد عادل العليمي

وحدة البحث لآلليات الذكيةREsearch Group on Intelligent Machine (REGIM)

–ية للمهندسين بصفاقسطن المدرسة الو-جامعة صفاقس تونس

باللغة الحاسوب علوم لممارسة الرابع العالمي المؤتمرالعربية

قطر – 2008أفريل 4- 1 ،الدوحة

Page 2: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

2

الفهرسالمقدمة ترقيم المكتباتمزاياأهمية و إشكاليات ترقيم الوثائق القديمة واقع إصالح انحناء وتقوس الكتابة في الوثائق

القديمةوتطبيقها إصالح االنحناء بطريقة البيضاوياتالطريقة المقترحة النتائج والتحليليالخاتمة والعمل المستقبل

Page 3: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

3

المـقـدمـة يعكس الهامة قي العالم، التراث الثقافي والعلمي من المكتسبات

،شعوبالتنوع اللغات والثقافات بين

ل الوثائق المخطوطة العربية القديمة تIجزءمث ًLا من هذا ًا هام، يجب نوعهامن نفيسة وفريدة ةثقافي ثروة ملوهي تح التراث

الحفاظ عليها،

لذلك أصبح ترقيم هذه الوثائق ومعالجتها بالطرق المعلوماتيةلألجيال في حالة حسنة بصفة دائمة لبقائهاضرورة ملحة الحديثة

،القادمـة

ف، على المكتبات العربية أن تتطور وتستعمل اهداأل ه للوصول لهذ،التكنولوجيات الحديثة المعلوماتية والتي توفرهاهائلة اإلمكانيات ال

عملية في صور الوثائق القديمةةإصالح انحناء وتقوس الكتاب يعتبرنهامة من عمليات ما قبل المعالجة فهو Lفي مرد بصفة جليةيحس

.ودية أنظمة التعرف اآللي للكتابة

Page 4: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

4

ء المكتبات الحالية مكان تجمع كمية هائلة لألوراق تستلزم فضا ات شاسعة،

ن الترقيم من استعمال الشكل الرقمي االلكتروني للوثائق وLيمك

شعار ”مكتب بدون وتكريسبالتالي التقليل من استعمال الورق،

    ورق“

المكتبات الحالية منغلقة على نفسها وتكتفي بما لها من وثائق

،ذاتية، وعليها أن تنفتح على المكتبات األخرى الكتمالها

ال يمكن حل كل هذه المشاكل إال باستعمال الوسائل الرقمية

  المكتبات تتحمل مسؤولية تمكين الباحثين والقراء الحديثة، ألن

، الوثائقي وتسهيل اإلطالع عليه وإثرائه وتطويره من زادها

أهمية ترقيم المكتبات

Page 5: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

5

القديمةقالمحافظة على الكتب و الوثائ شكل بتوفيرن إمكانيات المطالعة يحست

إلكتروني للكتاب للقارئعبر شبكة المطالعة الجماعية للكتاب الواحد

اإلنترنت ادرة و نشرهاLمة والنLإحياء المخطوطات القي

على األقراص الليزرية. تمكين المستعمل من الشكل االلكتروني ومن

أدوات خاصة تسهل التعمق في دراسة الوثيقة.

مزايا ترقيم المكتبات

Page 6: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

6

الكامـلة للوـثائق المخطوـطة عملـية دقيقةة اآللـيةالـقراءتنــوع الخــط وألن ميــدان الوثــائق يتطلب لكــثرة وصــعبةارس ارس ومناـجومنافـه ير من فـه بر بكـث رف ـجد أـك د التـع

يتعـرض هـذاـ الميـدان إلـى عـدة عراـقيـل، اآلـلي للكتابـة. منهـــــا:

وانحناء وتقوس الكتابة، اعوجاج الصفحـــات ”النص الظاهر في شكل "أمـــواج ، الظل الناتج عن داخل التسفيـــر مناطق ،ظهور النص المكتوب خلف الصفحـــة بفعل شفافية الورق  ، ورق، ممـا يجعـل القـراءة غـير ة على اـل دى والرطوـب  ظهـور بقـع الـن

،ممكنةاألوراق البالية أو المطويـــــة  ،.تنوع أشكال الكتب والخـــــط  

إشكاليات الوثائق القديمــة

Page 7: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

7

: عينة من صور لوثائق عربية قديمة ونرى الشوائب العالقة بها 1 رسم

صور وثائق عربية قديمةنماذج

Page 8: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

8

تصوير الوثيقة بآلة السكنار

صورة خام للوثيقة

ترميم الوثيقة وتنقيتها من

البقع

إصالح هندسي

صورة معالجة

تحليل الصور

ضغط الصورصور محللة

سلسلة تحليل ومعالجة الوثائق : 2رسم القديمة

تحليل الوثائق القديمة و معالجة

Page 9: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

9

عند عملية الترقيم، يمكن أن تظهر على صورة ذات خاصة بالنسبة للوثائق كثيرةالوثيقة تشوهات

من رة و المتكونة من عدد كبير فLلمسالحجم الكبير، ااألوراق،

يظهر تقوس في الكتابة وانحناء في خطوط النصوص وتغير في اإلضاءة على مختلف أجزاء الصفحة

المرقمة. الدراسة المقدمة في هذا المقال تهتم بمرحلة

ترميم صورة الوثيقة وهي مرحلة هامة من مراحل ما قبل المعالجة في سلسلة تحليل الوثائق.

نركز هنا على إصالح االنحناءات والتقوسات في الكتابة، والذي يمكLن بدوره من تحسين نسبة التعرف

في أنظمة القراءة اآللية للكتابة من جهة، ويمكLن أيسر ومريحة أكثر بالنسبة ةمباشر القارئ من قراءة

لنفس الوثيقة بدون إصالح.

إصالح انحناء وتقوس الكتابة في مبررات الوثائق القديمة

Page 10: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

10

الكتابة في الوثائق إصالح انحناء وتقوسواقع القديمة

عدة أدوات معلوماتية في ما يخص الوثائق أنجزتالقديمة الالتينية، تمكLن من تقويم الكتابة بعد إجراء

التحويرات الهندسية الالزمة عليها.

مطبوعا ذات أسطر التينياوثيقة تحمل نصا: 3رسم منحنية ومقوسة

. : نفس الوثيقة بعد إصالح انحناء الكتابة بها4رسم

Page 11: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

11

: وحدودهاإصالح انحناء الكتابةطرق و مراحل بعض

- ينجز اكتشاف االنحناء و التقوس على مستوى أسطر النصوص،

جربت طريقة شودوري على الوثائق الهندية ذات -الخطوط المتعددة،

للتقطيع " X-Y cutأسماها "إنجاز خوارزمية خاصة تم -.Y و Xالمتناوب ذات االتجاهين

تنجز اإلصالحات بتطبيق التغييرات الهندسية التي تحول -البيكساالت قي الصورة الخام لتجد مكانها األصلي بأكثر

دقة ممكنة.

خوارزمية لها حدودها : تتأثر أشكال األحرف بفعل -اإلصالح الهندسي ويمكن أن تظهر فوار ق تؤدي إلى تعدد أشكال األحرف حتى في المناطق ذات االنحناء

.الضعيف

الكتابة في الوثائق القديمة انحناء وتقوس إصالح

Page 12: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

12

القديمةالعربية الكتابة في الوثائق انحناء وتقوس إصالح

- عدد األبحاث في ميدان إصالح انحناء الكتابة في الوثائق العربية القديمة محدود جد�ا

اقتصرت األشغال التي تمL إنجازها على الوثائق العربية بصفة عامة-

أعمال مرحلة ما قبل المعالجة في الوثائق القديمة مثل إصالح -االنحناء والتفريق بين السطور وتقدير السطر القاعدي هي أعمال

تمثل مراحل أولية ذات أهمية كبرى تدخل في إنجاز نظم التعرف اآللي للكتابة المخطوطة.

نتائج هذه النظم مرتبطة كثيرا بمرحلة ما قبل المعالجة.-

تعتمد طريقة إصالح االنحناء على احتساب زاوية السطر-

افتراض أن الزاوية هي نفسها بالنسبة للوثيقة كلها، ال يكون -صحيحا إال إذا كانت الوثيقة كلها منحنية وليس لبعض األسطر فقط.

يبقى المقياس األهم لطريقة إصالح االنحناء هو أن الكلمة العربية -تكتب على خط قاعدي، والذي يتم التعرف عليه بالحصول على قمة

حادة في رسم اإلسقاط األفقي.

تكمن الفكرة األساسية في هذه المقاربة قي اقتراض أن الخط -القاعدي للكلمة معروف مسبقا، لكن عندما تكون الكلمات غير مفرقة يتم العمل بمجموعة من الكلمات أو ما يسمى بالعناصر

المرتبطة.

يقع إصالح االنحناء أو التقوس بدوران الكلمة حول مركزها في -االتجاه المعاكس.

Page 13: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

13

من الكلمات العربية المخطوطة على أسطر منحنيةو عــةم مج : استشعار الخط القاعدي في5رسم

العربيةالكتابة في الوثائق القديمة إصالح انحناء وتقوس

Page 14: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

14

: إصالح االنحناء لكل كلمة6رسم

Page 15: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

15

- نقائص الخوارزمية : االنحدار الذي يتولد عن البحث عن الخط القاعدي المحتوي على كلمات بها نقاط ورموز شكل كبيرة بالنسبة

لحجم الكلمة.

- يمكن حل هذا المشكل بفسخ النقاط والرموز أوليا قبل البحث عن السطر القاعدي

الحتساب انحناء النص اختار سيهاد أن يقارن بين أربع طرق : -طريقة ترنكلين، طريقة التساقط، تغييرات هوغ، وطريقة

التربيعيات االصغر. تعتبر هذه الطريقة سريعة وغير حساسة للتشويش ومالئمة لعدد -

كبير من الوثائق المحتوية على رسوم ولكنها تستلزم سطوًرا محددة لليسار وهي غير مالئمة للوثائق ذات األعمدة المتعددة. إذ أن

+ درجات.10- و °10مقياس الزاوية يكون بين ° تعتمد طريقة التساقط على احتساب الرسم البياني التاريخي -

واألفقي لصورة الوثيقة لكل زاوية تنتمي إلى مجال االكتشاف. تعتبر هذه الطريقة سهلة التركيز ومالئمة للوثائق ذات البنية -

البسيطة، لكنها غير مالئمة للوثائق المتشعبة المحتوية على رسوم + 10- و °10أو صور فوتوغرافية وتكون زاوية االنحناء بين °

درجات. طريقة هوغ هي تقنية تمكن من اكتشاف السطور والخطوط -

و 0المنحنية وهي مستعملة أيضا الكتشاف زاوية انحناء تكون بين درجة. هذه الطريقة مضبوطة ودقيقة و مالئمة لوثائق متعددة 180

األعمدة، ولكنها تستلزم ذاكرة كبيرة ووقت معالجة مرتفع جدLا.

Page 16: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

16

بأنها تتميز التي المطبوعة العربية الكتابة على الطريقة هذه تطبيق يمكنهذا يفسر األحرف، بين الربط على التطبيق هذا ويعتمد مسترسلة كتابة

ونقس الطول نفس ولها السطر نفس على ترتكز الروابط أن باعتبار االختياراالرتفاع.

التالي : النحو على الروابط اكتشاف يتمالمرتبطة • العناصر تصفية و استخراجالروابط • تصفية و اكتشافاالنحناء • زاوية اكتشاف

: تصفية العناصر المرتبطة7رسم

Page 17: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

17

( a) منحني الروابط( b) نص الروابط( c )استشعار مراكز بعد( d ) نقاط النصإصالحه

: مراحل اصالح 8رسم االنحناء ب - صورة لمائة بالنسبة االشتغال وقت جدا 12قدر ضئيل وقت وهو ثانية

وهو الصورة نقاط جميع يستعمل برنامج اشتغال بوقت و 30مقارنة دقيقةثانية 18

الضبط - تصل %89نسبة النسبة وهذه االنحناء، لزاوية مدقق الكتشافخطأ °%96الى مجال اعتبرنا . 1إذا

Page 18: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

18

المكتشفة - الروابط من متأت التدقيق قلة سببقي والموجودة السطر تحت المكتوبة األحرف في

. الوثائق لبعض السيئة الحالة ومن الكلمات آخر

- " احتساب " على تعتمد األقرب الجيران طريقة . اثنتين جارتين مكونتين كل بين الرابط السطر اتجاه

األعمدة ذات للوثائق مالئمة الطريقة تعتبرمرتفع. المعالجة وقت فإن المقابل، في المتعددة

وللكتابة للتشويش حساسة الطريقة وتعتبر جدا. العربية للوثائق المسترسلة

Page 19: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

19

ذات متوازية سطور αزاوية

: بناء متوازي 9رسم األضالع

طريقة متوازي األضالع

بالمناطق أو أضالع متوازيات من المكوcنة االنحناء زوايا الطريقة تقدر. لها المكملة

. االنحناء زوايا بمختلف السطور بإتباع أضالع متوازي كل بناء يتم

. المناطق عدد حسب القطع من مجموعة إلى السطور تقسم

لكل بالنسبة نفسها هي االنحناء زاوية أن اعتبار قي األساسية الفكرة تكمن. النص سطور

انحناء " زاوية ذات أضالع متوازي في الوثيقة مكونات كل "αتوضع

Page 20: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

20

) ب) منحنية أسطر ذات وثيقة - 4,6أ درجات

) منحنية) أضالع لموازيات مقربة الوثيقة ب درجات- 4,6

) انحناء) بزاوية للوثيقة تقريبية صورة جبدرجتين

: بناء متوازيات األضالع لمختلف 10رسم زوايا االنحناء

طريقة متوازي األضالع

البرنامج : اشتغال وقت معدل

انحالل 1,53- لدرجة البوصة 300ثانية في نقطة

انحالل 0.26- لدرجة .100ث البوصة في نقطة

Page 21: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

21

[Bab 06] بايو وكوما ها اقترح

: تعتمد على

التعرف على المكونات و البحث على اتجاه كل كلمة في النص. -.المرتبطة

.البحث على زوايا االنحناء األقرب في البداية -

يرتكز تقدير زاوية االنحناء على البحث على مركز كل مكون مترابط -في الوثيقة وعلى إحاطته بشكل بيضاوي.

يكون اتجاه مكون مترابط زاوية تحصر بين المحور المرجعي -والمحور األساسي الذي يدور حوله العنصر المرتبط بدفعة دنيا.

وتطبيقها طريقة البيضاويات

Page 22: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

22

وتطبيقها طريقة البيضاويات

) بيضاوي أ ) بشكل المرتبط العنصر ( إحاطة الكتابة) اتجاه زاوية احتساب ب

: طريقة التعرف على زاوية االنحناء11رسم

Page 23: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

23

يقع تقدير زاوية االنحناء بإنجاز الرسم البياني •التاريخي لكل زوايا االنحناء قي الوثيقة

وبالبحث عن القمة القصوى.

نحصل بذلك على العدد األقصى للكلمات •المتجهة في هذا االتجاه

معدل االتجاهات يمثل زاوية االنحناء .•

أمكن تقدير نجاعة المثال الخوارزمي المقترح •بتجربته على بنوك معطيات مختلفة.

يقدم الجدول التالي احتساب الخطأ بالنسبة •للزاوية المتحصل عليها بمقارنتها باالنحناء

األصلي. يبين الجدول أن نسبة الخطأ تنحصر .% 2 و 1.5بين

وتطبيقها طريقة البيضاويات

Page 24: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

24

: مقارنة نتائج االنحناء لمختلف الكتابات1جدول

التوقيت الجملي

نسبة الخطإ

( %)

اإلنحناء المتحصل عليه

اإلنحناء

األصلي

الصورة

4,797 1,7 4,915 5- مخطوط

6,422 0,605 20,121 20 نص مطبوع إنقليزي

4,567 1,828 -6,872 -7 نص مطبوع cادا كن

النتائج

Page 25: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

25

يتبين من دراسة واقع إصالح االنحناء السابقة أن مقاربات •التعرف على االنحناء في صور الوثائق كثيرة ومتعددة،

وتستعمل في ، جلها مطبق على الوثائق المطبوعة الالتينية •. ]-15°+،15°[ انحناء في مجال التعرف على زوايا

وقت التعرف يكون عادة مرتفعا خاصة عند استعمال طريقة •هوغ.

: طريقة البيضاويات نقترح مقاربة ترتكز على

- هي طريقة أبسط من حيث عدد المراحل المتبعة ووقت التعرف - وقع تطبيق هذه المقاربة على الوثائق العربية القديمة المطبوعة. - يتم التعرف على العناصر المرتبطة، ثم يتم تقدير زاوية االنحناء

بالبحث على مركز كل عنصر مرتبط، هذا المركز هو مركز البيضاوية المحيطة بالعنصر المرتبط.

وتكون زاوية االنحناء المحصورة بين المحور المرجعي والمحور (.12األساسي )رسم

طريقةالالمقترحة

Page 26: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

26

زاوية حساباالنحناء

حسب الصورة دوران θالزاوية

θ

مكتشف كاني

تمطيط الصورة

: سلسلة إصالح انحناء الكتابة على 12رسم الطريقة المقترحة

الوثيقة صورة

اإلنحاء إصالح بعد الوثيقة صورة

Page 27: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

27

النتائج والتحليل

.

) منحني ) نص ( أ ممطط) نص ( ب االنحناء) إصالح بعد النص ج

منحني: 13 رسم واحد سطر ذات نص على المقترحة الطريقة تطبيق

) ذات) منحني نص ( أسطر 3أ ممططة) الصورة ( ب إصالح) بعد النص صورة جاالنحناء

: تطبيق الطريقة المقترحة على نص ذات عدة أسطر منحنية 14رسم

Page 28: إصلاح  انحناء وتقوس الكتابة  في صور الوثاق العربية القديمة

28

عرضنا وطبقنا قي هذه الورقة مقاربة إلصالح االنحناء في صور الوثاق العربية المطبوعة. وقد فصلنا مراحل الطريقة المتبعة التي

ترتكز على تقنيات بناء البيضاويات للنص المنحني، وذلك لتقدير زاوية االنحناء. هذه التقنيات القائمة على التمثيل الرياضي، وجدت

نية والهندية.نجاحا هاما في معالجة النصوص الالتيتعد النتائج المتحصل عليها بعد تطبيقها على النصوص العربية

أعمال أخرى كالوثائق العربية المطبوعة جد مشجعة وتفتح اآلفاق لالمخطوطة وغيرها من الوثائق، والمأمول تطوير خوارزميات تمكن

من تقدير الزوايا لكل قطعة أو شبه قطعة للسطر المنحني. يعتبر هذا العمل مرحلة هامة من مراحل ما قبل المعالجة للوثائق

القديمة وذلك لتحسين نوعيتها للقارئ المطلع عليها من جهة وترفيع نسبة التعرف في أنظمة التعرف اآللي للكتابة من جهة أخرى.

الخاتمة والعمل المستقبلي