فهرست‌بندی کتابهای فارسی: August 2004

فهرست‌بندی کتابهای فارسی

Monday, August 23, 2004

کتابهای صوتی فارسی:

فکر قرار دادن کتابهای صوتی یا همان کتاب خوانی روی اینترنت کار جالبی است. امروز به این صفحه رسیدم که کتابهای شرلوک هولمز را به صورت صوتی( البته به زبان انگلیسی) در دسترس قرار داده است. این صفحه هم شما را یه دیگر کتابهایی می برد که توسط رایانه خوانده می شود. البته توانایی خوانده شدن با رایانه اکثرا" برای فابل های انگلیسی با فرمتPDF در نسخه آخرAcrobat Reader یعنی نسخه 6 آن وجود دارد.
اما آیا چنین چیزی نیز ما فارسی زبانان داریم؟ یادم آمد که خودم حداقل دو کتاب صوتی فارسی را روی اینترنت دیده ام. دنبال کتابهای دیگر گشتم ولی کمتر یافتم.
رفتم در برنامه های رادیو گشتم شاید بایگانی برنامه"قصه ظهر جمعه" را پیدا کنم ولی هنوز آن را بایگانی نکرده اند.
اما کتابهایی که می توانید روی اینترنت به زبان فارسی بشنوید:
داستان "حاج باريكلا" اثر "ميهن بهرامي" با صداي نويسنده. تهیه از سایت سخن.( حجم 4.65MB).
داستان" شازده کوچولو" اثر آنتوان دو سنت اگزوپری" با صدا و تنطیم" ایرج گرگین" از سایت پرشین سافت.( حجم 14.62 MB)
اگر شما هم از کتاب های صوتی دیگری به زبان فارسی اطلاع دارید به ما بگویید.

آموزش ضربتی استفاده از موتور جستجو

جستجوی کتاب در کتابخانه خود هنری‌است که کمتر بدان پرداخته‌ شده‌است. در این میان جستجوی رایانه‌ای جایگاه ویژه خود را دارد. هدف ما در این مختصر تنها آموزش مهارتهای ابتدایی برای استفاده از این فهرست است. گرچه جولانگه ما سخت محدود است، امیدواریم که همین مختصر کاربران را مسلح به مهارتهایی چند کند.
الف) ساختار فهرست:
آگاهی از ساختار درونی فهرست به هوشمندانه‌(تر)شدن جستجوها کمک شایانی می‌نماید.
هر کتابی که در فهرست موجود می‌باشد حداکثر ۱۰ مشخصه دارد که از این قرارند:
۱) ID یا شماره ی منحصر به فرد: هرکتاب یک شمارهٔ منحصر به فرد دارد که یک عدد شش رقمی است. این عدد به ارقام انگلیسی است. 0123456789 شماره کتاب از 000001شروع می‌شود و بالا می‌رود. چنانکه ملاحظه می‌نمایید صفرهای پیش از عدد منظور می‌شوند.
۲) title عنوان: احتیاج به توضیح خاصی ندارد.
۳) Authorsنویسنده(ان): نخست نام خانوادگی نویسنده درج می‌شود و سپس نام کوچک که با ویرگولی «،» از نام خانوادگی جدا می‌گردد. اگر نویسندگان بیش از یک نفر باشند نام آنها با «/» (بدون گیومه) از هم جدا می‌شود. در فهرست از القاب تحصیلی/ علمی افراد اجتناب شده‌است جز در مواردی بسیار معدود که این القاب سخت با نام افراد عجین بوده‌اند. در آن صورت در داخل پرانتز و بعد از نام کوچک درج شده‌اند. مثال (قزوینی، محمد (علامه))
۴) Translator مترجم: شبیه نویسنده است.
۵) Editor ویراستار: گرچه نام مشخصه ویراستار است ولی در عمل می‌تواند دربردارنده‌ی نام مصحح یا کوششگر هم باشد: مثلا «کلیات سعدی» به تصحیی «فروغی» یا «مبارزات سیاسی سید جمال‌الدین اسدآبادی» به کوشش «هادی خسروشاهی». درج نام اشخاص همانند نویسنده و مترجم است.
۶) Address نشانی: نشانی الکترونیکی کتاب است و با http آغاز می‌گردد.
۷) subject موضوع: از کل به جز می‌رود و شاخه از زیر شاخه با «/» جدا می‌گردد. در مواردی که کتاب به دو موضوع یا بیشتر اشاره کند موضوعات با ویرگول«،» از هم جدا می‌گردند.برای دیدن فهرست کلی موضوعات به اینجا بروید.
یک مثال:ادیان / اسلام / مذاهب / تشیع
۸) provider تهیه کننده: نام تهیه کنندهٔ الکترونیکی کتاب است.
۹) date تاریخ : این مشخصه هنوز کارکرد به خصوصی ندارد.
۱۰) comments ملاحظات: دربردارنده‌ی توضیحات اضافی پیرامون کتاب است.
ب) زبان و دستور خط
ا) زبان جستجو فارسی است! تنها آدرس الکترونیکی کتابها و اصطلاحهای تکنیکی چون html و php و امثال آن به انگلیسی است.
۲) در فهرست از «ک» و «ی» فارسی استفاده شده است که با « ك» و «ي» عربی متفاوت است هرچند که در حالت چسبیده ممکن است یکسان به نظر بیایند.
۳)‌ از تشدید، جز در کلمه الله که به‌ صورت خودکار توسط واژه‌نگار وارد می‌شود، اجتناب شده است.
۴) از ی (حتی مقصوره)‌ در حکم کسره‌ی اضافه بعد از های ناملفوظ اجتناب شده است. مثال:‌ «یک نامه عاشقانه»، نه «یک نامه‌ی عاشقانه» یا «یک نامهٔ عاشقانه» یا هر قسم دیگری.
پ)‌ عملگرهای منطقی:
فعلا از تمام عملگرهای منطقی نمی‌توان در جستجوها استفاده کرد. برای "و" منطقی یا چیزی مشابه آن باید از "%" استفاده شود. تفاوت "%" با "و" منطقی اینست که در "%" ترتیب رعایت می‌شود.
مثال: فرض کنید می‌خواهید کتابی را بیابید که در عنوان آن دو کلمهٔ «سکولاریسم» و «غرب» به کار رفته است. («سکولاریسم» پیش از «غرب» آمده است). برای انجام این جستجو در فیلد "Title عنوان"چنین می‌نویسید:«سكولاریسم%غرب» (بدون گیومه) توجه شود که علامت «%» انگلیسی‌است و با «٪» فارسی متفاوت است.
ت) نمونه‌هایی از جستجو:
در این قسمت به ذکر چند نمونه می‌پردازیم. از آنجا که ممکن است بعضی از خوانندگان از این قسمت آغاز به خواندن کنند به شبیه بعضی از مثالهای بالا دوباره در زیر اشاره شده‌است.
۱) با یک مثال ساده آغاز می‌کنیم:
فرض کنید که می‌خواهیم کتابهایی را که به قلم «صادق هدایت» است بیابیم.نوشتن «صادق هدایت» (با ی بی نقطه و بدون گیومه) در فیلد نویسنده اشتباه محض است! و نتیجه جستجو تهی خواهد بود! چرا که کامپیوتر بی‌زبان به دنبال «عین» عبارت «صادق هدایت» (حتی فاصله را هم در نظر می‌گیرد) می‌گردد و مسلما با دستی تهی باز می‌گردد. چرا که در فهرست، نام خانوادگی پیش از نام کوچک آمده است. پس «عین» عبارت «صادق هدایت» در فهرست وجود ندارد. نزدیک‌ترین عبارت به آن «هدایت، صادق» است.باید توجه داشته باشیم که وارد کردن «هدایت صادق»‌ هم نتیجهٔ تهی خواهد داشت!(شما بگویید چرا)
پس یک راه حلْ وارد کردن «هدایت، صادق» در فیلد نویسنده خواهد بود. احتمالا این بار نتیجه‌ی بهتری عایدمان خواهد شد.
ولی این «هوشمندانه‌ترین» طریق جستجو نیست چرا که مثلا ممکن است هنگام وارد کردن کتاب در فهرست یک فاصلهٔ زیادی بعد از ویرگول وارد شده باشد (یعنی «هدایت،‌ صادق» به جای «هدایت، صادق») بنابراین آن کتاب (به خاطر این اشتباه) در نتیجهٔ جستجو موجود نخواهد بود. (چون «هدایت،‌ صادق» «عین» «هدایت، صادق» نیست)
یک راه بهتر وارد کردن عبارت «هدایت%صادق» است. چنانکه پیشتر آمد، معنی «%» اینست که بین «هدایت» و «صادق» هر تعداد حرف و علامتی می‌تواند بیاید. باید دقت کنیم که بین «هدایت»، «%» و «صادق» هیچ فاصله‌ای نباشد.
گاهی ممکن است که نام کوچک نویسنده به دلیلی وارد نشده باشد یا فقط حرف اول آن وارد شده باشد (مانند «هدایت، ص»). بنابراین جستجویی مانند «هدایت%صادق» هم نتیجه‌اش تهی شود. بدیهی است که ما باید نا‌امید نگشته و صورتهای دیگر را هم بیازماییم: مثلا «هدایت» یا «هدایت%ص» . لازم به ذکر است که نتیجهٔ جستجوی آخری دربرگیرنده‌ی نتیجهٔ جستجوی «هدایت%صادق» خواهد بود.
اکنون که پیرامون «%» سخن می‌رانیم بد نیست به نکتهٔ دیگری نیز اشاره نماییم: چنانکه می‌دانید هنوز توافقی قطعی بر سر جدا (مانند «بی حاصل») یا سرهم (مانند «بیحاصل») یا بی‌فاصله (مانند «بی‌حاصل») نویسی بسیاری از کلمات حاصل نشده است. در این فهرست حتی‌المقدور سعی شده است که از دستور خط مصوب فرهنگستان(http://persianacademy.ir/books/Dastoor-e%20khatt.pdf) استفاده شود. با این حال پیشنهاد می‌گردد که هنگام وارد کردن کلمات چندجزئی، میان اجزا از «%» استفاده نمایید (مخصوصا اگر ابتدا حالت خاصی را وارد کردید و نتیجه‌ای مطلوب نگرفتید) مثلا اگر به دنبال کتابی از نویسنده‌ای با نام خانوادگی خسروشاهی هستید، بنویسید «خسرو%شاهی». البته در این صورت ممکن است در حاصل جستجو چند کتاب بی‌ربط (مثلا کتابی که دو نویسنده دارد : فلان‌زاده، خسرو / شاهی، فلانی ) هم ظاهر شود ولی احتمال از قلم افتادن کتاب تقلیل می‌یابد.
آشکار است که تکنیکهایی که یاد می‌شوند برای فیلدهای دیگر هم کاربرد دارند.
۲) اکنون فرض کنید به دنبال «گلستان سعدی» هستید. قبل از هر چیز دربارهٔ شعرا و نویسندگان کلاسیک باید به خاطر داشت که نام آنها در عنوان کتابهایشان نمی‌آید. یعنی دقیقا همانند سایر نویسندگان (و شعرا) با ایشان رفتار شده‌است.
بنابراین برای یافتن «گلستان سعدی» وارد کردن «گلستان سعدی» در فیلد «عنوان Title» نادرست است و نتیجهٔ جستجو تهی خواهد بود. باید در فیلدِ «عنوان» «گلستان» را وارد کرد و در فیلدِ «نویسنده» «سعدی» را.
مهم: با فشردن دگمهٔ جستجو، کامپیوتر کتابهایی را می‌جوید که در عنوانشان کلمه‌ٔ «گلستان» «به کار رفته‌‌است» و (این واو منطقی است) در نام نویسنده‌شان کلمه‌ٔ «سعدی».

Monday, August 16, 2004

برای جستجوی کتابهای فهرست‌بندی شده به اینجا بروید
http://persianbookslisting.mybesthost.com

Saturday, August 14, 2004

نرم افزار تشخيص متون تايپي براي زبان فارسي

توليد محتواي فارسي الکترونیکی از روي كتاب‌هاي موجود، آرشيو متون مجلات، آرشيو پايان‌نامه‌ها و مقالات، .مديريت اسناد و تصاوير متني، همچنین توانایی تبديل تصوير به گفتار از امکانات این نرم افزار می باشد.
مهران

Friday, August 13, 2004

آغاز دفتر

این روزها شاهد رشد فزایندهٔ کتابخانه‌های دیجیتال به زبان فارسی هستیم. متاسفانه تاکنون حرکت قابل ملاحظه‌ای برای سامان‌ و سازمان‌دهی خیل نسبتا عظیم کتابهای فارسی موجود در اینترنت انجام نگرفته‌است. بی‌شک فهرست‌بندی این کتابها کار را بر محققان و جستجو‌گران آسان می‌کند. از این رو دست به کار شده و گروهی در یاهو برپاساختیم. لینک آن در سمت چپ این وبلاگ موجود است. اینک به اختصار پیرامون این گروه سخن رانیم:بی مناسبت نمی‌بینم که متنی را که نخستین بار در گروه farsibook(متعلق به صاحب ارجمند وبلاگ farsibooksonline.blogspot.com) قرار دادم (با اندکی تنقیح) در اینجا نیز درج کنم:
«دوستان گرامی:
آیا به نظر شما زمان آن فرا نرسیده است که سر و سامانی به لیست کتابهای فارسی داده شود؟ چنانکه دوستان احتمالا متوجه شده‌اند لیست بسیار طویل شده است و لحظه به لحظه استفاده از آن مشکلتر می‌شود. به نظر بنده باید یک Database درست کرد و کتب را فهرست‌بندی کرد، چیزی شبیه فهرست موضوعی farsibookonline ولی بسیار جامع تر. روش کار به این صورت است: ما یک database table درست می‌کنیم و هرکس به نوبه خود می‌تواند در کامل کردن این جدول (table) تشریک مساعی کند. بعدا اگر کسی امکانات داشت می‌تواند یک database Server راه بیندازد و از این جدول سود بجوید. لازم به توضیح نیست که در صورت راه‌افتادن این database امکانات جستجو بسیار بهبود می‌یابد . مثلا به راحتی می‌توان تمام کتابها به قلم فلان نویسنده را مشاهده کرد و .... بسیاری از میزبانان فضای اینترنتی به مشترکین خدمات SQL که مربوط به همین database هاست ارایه می‌دهند. به هر حال قسمت زمان‌گیر پروژه وارد کردن اطلاعات مربوط به کتب است. در حال حاضر هرکس می‌تواند سطر جدیدی به آن جدول اضافه نماید. (پس از عضویت در گروه)(یعنی کتاب اضافه کند) آدرس فعلی: http://groups.yahoo.com/group/listoffarsibooks برای اضافه کردن کتاب به لیست روی Database سمت چپ کلیک می‌کنید سپس روی LIST OF PERSIAN BOOKS کلیک می‌کنید. آنگاه روی Add record و اطلاعات مربوط را وارد می‌کنید.»
همکنون (هنگام نوشتن این متن) این جدول دربرگیرندهٔ نام ۱۲۰ کتاب است که هنوز سخت ناچیز است لیک به آرامی گام بر می‌داریم ودر این حرکت نیازمند همیاری تمام دوستانیم. اگر ۲۰ نفر عضو فعال به گروه ملحق شوند و هرکدام به طور میانگین تنها ۳ کتاب در روز به لیست اضافه کنند (یعنی حدود پنج دقیقه صرف وقت) نه تنها بام جوانمردی را توخته‌اند بلکه در کمتر از یک ماه تمام کتابهای معرفی‌شده در«FarsiBooksOnline» فهرست‌بندی می‌شود.
همچنین برای نشان دادن قابلیت‌های چنین مجموعه‌ای (یعنی database table)، نرم‌افزاری تهیه شده است که به کاربر امکان جستجو در این فهرست را می‌دهد. لیک چون هنوز گسترهٔ جستجو سخت محدود است (یعنی تنها ۱۲۰ کتاب) اهمیت موضوع به نیکی درک نمی‌شود. به هر صورت این نرم‌افزار به زودی در قسمت فایل گروه مذکور در بالا قرار خواهد گرفت و توضیحاتی نیز پیرامون شیوهٔ استفاده از آن خواهد آمد. امیدواریم که آتش همت دوستان از این طریق تیزتر گردد.
با دید خوشبینانه روند قضایا احتمالا بدین صورت خواهد بود که تنی چند از صاحبدلان با خواندن این مطلب دعوتمان را اجابت کرده و به جرگهٔ ما خواهند پیوست. خیل کثیری نیز ترجیح خواهند داد که از دور نظاره‌گر امور باشند و بعضا ما را با پیامهای آکنده از محبت نواخته و از پیشنهادها و انتقادهای خود بهره‌مند سازند!
این وبلاگ (جز جستار اول آن یعنی همین مطلب) بیش از هرچیز برای ارتباط با این گروه دوم است چرا که یکی از رازهای موفقیت پروژه‌های فرهنگی (به خصوص پروژه‌هایی که ثمراتشان مستقیما مورد استفادهٔ توده خواهد بود) ارتباط با بدنهٔ اصلی و اکثریت کاربران (=مستفیدان) است که معمولا نقش بنیادین در اجرای پروژه ندارند. در نهایت ایشانند که غبار خستگی را از لوح خاطرمان می‌زدایند و اصولا (تا حد زیادی) به خاطر آنانست که پا در این وادی نهاده‌ و دست بر این کار یازیده‌ایم. پس اگرایشان از فعالیت‌های ما مطلع نباشند ( و بهره‌مند نگردند) وقت ضایع کرده‌ایم و خویشتن (بازتا حد زیادی) بیهوده فرسوده. راست است که با اتمام پروژه خود از زحمات خویش بهره‌مند خواهیم شد لیک ارج و اجرمعنویش آنچنان نخواهد بود. سخن با بیتی از یکی ازسخنسرایان بزرگ ایران (نظامی) به پایان می‌برم:
مگر صاحبدلی روزی به جایی / کند درحال این مسکین دعایی

Thursday, August 12, 2004

كتاب هاى ديجيتال و كتابخانه‏هاى مجازى فارسى در اينترنت،