فهرست‌بندی کتابهای فارسی: آموزش ضربتی استفاده از موتور جستجو

Monday, August 23, 2004

آموزش ضربتی استفاده از موتور جستجو

جستجوی کتاب در کتابخانه خود هنری‌است که کمتر بدان پرداخته‌ شده‌است. در این میان جستجوی رایانه‌ای جایگاه ویژه خود را دارد. هدف ما در این مختصر تنها آموزش مهارتهای ابتدایی برای استفاده از این فهرست است. گرچه جولانگه ما سخت محدود است، امیدواریم که همین مختصر کاربران را مسلح به مهارتهایی چند کند.
الف) ساختار فهرست:
آگاهی از ساختار درونی فهرست به هوشمندانه‌(تر)شدن جستجوها کمک شایانی می‌نماید.
هر کتابی که در فهرست موجود می‌باشد حداکثر ۱۰ مشخصه دارد که از این قرارند:
۱) ID یا شماره ی منحصر به فرد: هرکتاب یک شمارهٔ منحصر به فرد دارد که یک عدد شش رقمی است. این عدد به ارقام انگلیسی است. 0123456789 شماره کتاب از 000001شروع می‌شود و بالا می‌رود. چنانکه ملاحظه می‌نمایید صفرهای پیش از عدد منظور می‌شوند.
۲) title عنوان: احتیاج به توضیح خاصی ندارد.
۳) Authorsنویسنده(ان): نخست نام خانوادگی نویسنده درج می‌شود و سپس نام کوچک که با ویرگولی «،» از نام خانوادگی جدا می‌گردد. اگر نویسندگان بیش از یک نفر باشند نام آنها با «/» (بدون گیومه) از هم جدا می‌شود. در فهرست از القاب تحصیلی/ علمی افراد اجتناب شده‌است جز در مواردی بسیار معدود که این القاب سخت با نام افراد عجین بوده‌اند. در آن صورت در داخل پرانتز و بعد از نام کوچک درج شده‌اند. مثال (قزوینی، محمد (علامه))
۴) Translator مترجم: شبیه نویسنده است.
۵) Editor ویراستار: گرچه نام مشخصه ویراستار است ولی در عمل می‌تواند دربردارنده‌ی نام مصحح یا کوششگر هم باشد: مثلا «کلیات سعدی» به تصحیی «فروغی» یا «مبارزات سیاسی سید جمال‌الدین اسدآبادی» به کوشش «هادی خسروشاهی». درج نام اشخاص همانند نویسنده و مترجم است.
۶) Address نشانی: نشانی الکترونیکی کتاب است و با http آغاز می‌گردد.
۷) subject موضوع: از کل به جز می‌رود و شاخه از زیر شاخه با «/» جدا می‌گردد. در مواردی که کتاب به دو موضوع یا بیشتر اشاره کند موضوعات با ویرگول«،» از هم جدا می‌گردند.برای دیدن فهرست کلی موضوعات به اینجا بروید.
یک مثال:ادیان / اسلام / مذاهب / تشیع
۸) provider تهیه کننده: نام تهیه کنندهٔ الکترونیکی کتاب است.
۹) date تاریخ : این مشخصه هنوز کارکرد به خصوصی ندارد.
۱۰) comments ملاحظات: دربردارنده‌ی توضیحات اضافی پیرامون کتاب است.
ب) زبان و دستور خط
ا) زبان جستجو فارسی است! تنها آدرس الکترونیکی کتابها و اصطلاحهای تکنیکی چون html و php و امثال آن به انگلیسی است.
۲) در فهرست از «ک» و «ی» فارسی استفاده شده است که با « ك» و «ي» عربی متفاوت است هرچند که در حالت چسبیده ممکن است یکسان به نظر بیایند.
۳)‌ از تشدید، جز در کلمه الله که به‌ صورت خودکار توسط واژه‌نگار وارد می‌شود، اجتناب شده است.
۴) از ی (حتی مقصوره)‌ در حکم کسره‌ی اضافه بعد از های ناملفوظ اجتناب شده است. مثال:‌ «یک نامه عاشقانه»، نه «یک نامه‌ی عاشقانه» یا «یک نامهٔ عاشقانه» یا هر قسم دیگری.
پ)‌ عملگرهای منطقی:
فعلا از تمام عملگرهای منطقی نمی‌توان در جستجوها استفاده کرد. برای "و" منطقی یا چیزی مشابه آن باید از "%" استفاده شود. تفاوت "%" با "و" منطقی اینست که در "%" ترتیب رعایت می‌شود.
مثال: فرض کنید می‌خواهید کتابی را بیابید که در عنوان آن دو کلمهٔ «سکولاریسم» و «غرب» به کار رفته است. («سکولاریسم» پیش از «غرب» آمده است). برای انجام این جستجو در فیلد "Title عنوان"چنین می‌نویسید:«سكولاریسم%غرب» (بدون گیومه) توجه شود که علامت «%» انگلیسی‌است و با «٪» فارسی متفاوت است.
ت) نمونه‌هایی از جستجو:
در این قسمت به ذکر چند نمونه می‌پردازیم. از آنجا که ممکن است بعضی از خوانندگان از این قسمت آغاز به خواندن کنند به شبیه بعضی از مثالهای بالا دوباره در زیر اشاره شده‌است.
۱) با یک مثال ساده آغاز می‌کنیم:
فرض کنید که می‌خواهیم کتابهایی را که به قلم «صادق هدایت» است بیابیم.نوشتن «صادق هدایت» (با ی بی نقطه و بدون گیومه) در فیلد نویسنده اشتباه محض است! و نتیجه جستجو تهی خواهد بود! چرا که کامپیوتر بی‌زبان به دنبال «عین» عبارت «صادق هدایت» (حتی فاصله را هم در نظر می‌گیرد) می‌گردد و مسلما با دستی تهی باز می‌گردد. چرا که در فهرست، نام خانوادگی پیش از نام کوچک آمده است. پس «عین» عبارت «صادق هدایت» در فهرست وجود ندارد. نزدیک‌ترین عبارت به آن «هدایت، صادق» است.باید توجه داشته باشیم که وارد کردن «هدایت صادق»‌ هم نتیجهٔ تهی خواهد داشت!(شما بگویید چرا)
پس یک راه حلْ وارد کردن «هدایت، صادق» در فیلد نویسنده خواهد بود. احتمالا این بار نتیجه‌ی بهتری عایدمان خواهد شد.
ولی این «هوشمندانه‌ترین» طریق جستجو نیست چرا که مثلا ممکن است هنگام وارد کردن کتاب در فهرست یک فاصلهٔ زیادی بعد از ویرگول وارد شده باشد (یعنی «هدایت،‌ صادق» به جای «هدایت، صادق») بنابراین آن کتاب (به خاطر این اشتباه) در نتیجهٔ جستجو موجود نخواهد بود. (چون «هدایت،‌ صادق» «عین» «هدایت، صادق» نیست)
یک راه بهتر وارد کردن عبارت «هدایت%صادق» است. چنانکه پیشتر آمد، معنی «%» اینست که بین «هدایت» و «صادق» هر تعداد حرف و علامتی می‌تواند بیاید. باید دقت کنیم که بین «هدایت»، «%» و «صادق» هیچ فاصله‌ای نباشد.
گاهی ممکن است که نام کوچک نویسنده به دلیلی وارد نشده باشد یا فقط حرف اول آن وارد شده باشد (مانند «هدایت، ص»). بنابراین جستجویی مانند «هدایت%صادق» هم نتیجه‌اش تهی شود. بدیهی است که ما باید نا‌امید نگشته و صورتهای دیگر را هم بیازماییم: مثلا «هدایت» یا «هدایت%ص» . لازم به ذکر است که نتیجهٔ جستجوی آخری دربرگیرنده‌ی نتیجهٔ جستجوی «هدایت%صادق» خواهد بود.
اکنون که پیرامون «%» سخن می‌رانیم بد نیست به نکتهٔ دیگری نیز اشاره نماییم: چنانکه می‌دانید هنوز توافقی قطعی بر سر جدا (مانند «بی حاصل») یا سرهم (مانند «بیحاصل») یا بی‌فاصله (مانند «بی‌حاصل») نویسی بسیاری از کلمات حاصل نشده است. در این فهرست حتی‌المقدور سعی شده است که از دستور خط مصوب فرهنگستان(http://persianacademy.ir/books/Dastoor-e%20khatt.pdf) استفاده شود. با این حال پیشنهاد می‌گردد که هنگام وارد کردن کلمات چندجزئی، میان اجزا از «%» استفاده نمایید (مخصوصا اگر ابتدا حالت خاصی را وارد کردید و نتیجه‌ای مطلوب نگرفتید) مثلا اگر به دنبال کتابی از نویسنده‌ای با نام خانوادگی خسروشاهی هستید، بنویسید «خسرو%شاهی». البته در این صورت ممکن است در حاصل جستجو چند کتاب بی‌ربط (مثلا کتابی که دو نویسنده دارد : فلان‌زاده، خسرو / شاهی، فلانی ) هم ظاهر شود ولی احتمال از قلم افتادن کتاب تقلیل می‌یابد.
آشکار است که تکنیکهایی که یاد می‌شوند برای فیلدهای دیگر هم کاربرد دارند.
۲) اکنون فرض کنید به دنبال «گلستان سعدی» هستید. قبل از هر چیز دربارهٔ شعرا و نویسندگان کلاسیک باید به خاطر داشت که نام آنها در عنوان کتابهایشان نمی‌آید. یعنی دقیقا همانند سایر نویسندگان (و شعرا) با ایشان رفتار شده‌است.
بنابراین برای یافتن «گلستان سعدی» وارد کردن «گلستان سعدی» در فیلد «عنوان Title» نادرست است و نتیجهٔ جستجو تهی خواهد بود. باید در فیلدِ «عنوان» «گلستان» را وارد کرد و در فیلدِ «نویسنده» «سعدی» را.
مهم: با فشردن دگمهٔ جستجو، کامپیوتر کتابهایی را می‌جوید که در عنوانشان کلمه‌ٔ «گلستان» «به کار رفته‌‌است» و (این واو منطقی است) در نام نویسنده‌شان کلمه‌ٔ «سعدی».

0 Comments:

Post a Comment

<< Home