جست‌وجو در PDF فارسی

5,268 views
Skip to first unread message

افشین فلاطونی

unread,
Mar 4, 2012, 7:33:29 AM3/4/12
to persian-co...@googlegroups.com
سلام.
تمام برنامه‌های نمایش‌دهنده فایل‌های PDF امکان جست‌وجو را در خود دارند.
در بعضی فایل‌های PDF فارسی، می‌توان جست‌وجو کرد و واژه جست‌وجوشده را پیدا کرد ولی در بعضی دیگر، نه!
چرا؟
آیا این مشکل، با فونت استفاده‌شده مرتبط است یا علل دیگری دارد؟

متشکرم.

Mehrdad Senobari

unread,
Mar 4, 2012, 1:01:09 PM3/4/12
to افشین فلاطونی, persian-co...@googlegroups.com
سلام

در فرآیند جست‌جو در فایل‌های PDF فارسی، موارد زیر تأثیرگذارند:
  • فونتی که در متن اصلی استفاده شده،
  • برنامه‌ای که PDF را ایجاد کرده،
  • برنامه‌ای که جست‌جو در PDF رو انجام می‌ده
  • ؟
مورد سوم نقش مؤثرتری داره، و بنظرم افزونهٔ پی‌دی‌افی که توی Google Chrome استفاده شده، یکی از بهترین‌های این زمینه است.

موفق باشید
-- مهرداد



افشین فلاطونی

unread,
Mar 4, 2012, 1:14:44 PM3/4/12
to Mehrdad Senobari, persian-co...@googlegroups.com
متشکرم. اما منظور من جست‌وجوگر داخلی خود PDF بود!

در ۴ مارس ۲۰۱۲، ساعت ۲۱:۳۱، Mehrdad Senobari <seno...@gmail.com> نوشته:

Behnam Esfahbod

unread,
Mar 4, 2012, 1:39:58 PM3/4/12
to افشین فلاطونی, Mehrdad Senobari, persian-co...@googlegroups.com
افشین جان، فکر کنم منظورت از «خود PDF» همان Adobe Acrobat و Adobe Reader باشند، درسته؟

هر دوی این‌ها در همان دسته‌ی سوم در جواب مهرداد قرار می‌گیرند.

-بهنام


2012/3/4 افشین فلاطونی <fala...@gmail.com>



--
    '     بهنام اسفهبد
    '     Behnam Esfahbod
   '      http://behnam.esfahbod.info
  *  ..   Persian Internet Society
 *  `  *  http://persian-isoc.org
  * o *   3E7F B4B6 6F4C A8AB 9BB9 7520 5701 CA40 259E 0F8B

افشین فلاطونی

unread,
Mar 5, 2012, 12:41:29 PM3/5/12
to Behnam Esfahbod, Mehrdad Senobari, persian-co...@googlegroups.com
بله منظورم همان بود.
وقتی ما از برنامه‌ای واحد، برای ساخت دو فایل PDF (یکی فارسی و دیگری انگلیسی) استفاده می‌کنیم، آن برنامه هیچ گزینه‌ای ندارد که معین کنیم، فایل به‌دست‌آمده، جست‌وجو‌پذیر باشد یا نه!
در هر صورت، در فایل انگلیسی به‌راحتی می‌توان جست‌وجو کرد و در فایل فارسی نمی‌توان!

در ۴ مارس ۲۰۱۲، ساعت ۲۲:۰۹، Behnam Esfahbod <beh...@esfahbod.info> نوشته:

Behnam Esfahbod

unread,
Mar 5, 2012, 6:35:40 PM3/5/12
to افشین فلاطونی, Mehrdad Senobari, persian-co...@googlegroups.com
ابزارهای تولید فایل پی‌دی‌اف معمولا گزینه‌هایی دارند که می‌توانند در قابل‌جستجوبودن محتوا کمک کنند. برای نمونه، یکی از آن‌ها نهانیدن (embedding) متن با قالب اکس‌ام‌ال است. فکر کنم در لیبرآفیس این گزینه را دیده‌ام.



2012/3/5 افشین فلاطونی <fala...@gmail.com>

افشین فلاطونی

unread,
Mar 5, 2012, 10:27:52 PM3/5/12
to Behnam Esfahbod, Mehrdad Senobari, persian-co...@googlegroups.com
من از پنجره Options ساخت PDF لیبره‌آفیس عکس گرفتم. منظور شما کدام یک از گزینه‌ها است؟

در ۶ مارس ۲۰۱۲، ساعت ۳:۰۵، Behnam Esfahbod <beh...@esfahbod.info> نوشته:
Screenshot at 2012-03-06 06:56:08.png

Behnam Esfahbod

unread,
Mar 5, 2012, 10:35:52 PM3/5/12
to افشین فلاطونی, Mehrdad Senobari, persian-co...@googlegroups.com
نام درست اون Tagged PDF هست، که می‌تونین تو اون گزینه‌ها ببینین.


-بهنام


2012/3/5 افشین فلاطونی <fala...@gmail.com>

Behnam Esfahbod

unread,
Apr 16, 2012, 12:33:25 PM4/16/12
to fala...@gmail.com, محاسبات فارسی
در مورد Evince نمی‌تونم نظری بدم در این لحظه، ولی در Adobe Reader X در ویندوز هم جستجو کار نمی‌کنه. جالب اینکه گوگل کروم به خوبی می‌تونه پیدا کنه هر عبارت جستجو رو.

-بهنام


On Mon, Apr 16, 2012 at 11:51 AM, افشین فلاطونی <fala...@gmail.com> wrote:

من یک فایل PDF ضمیمه کرده‌ام که با استفاده از همین گزینه اصطلاحاً Tag دار شده است.

سه کلمه فارسی در این فایل هست و فایل را هم در برنامه Evince تحت لینوکس باز کردم. زمانی که فقط یک حرف را جست‌وجو می‌کنم آن حرف را بدون مشکل پیدا می‌کند اما وقتی یک کلمه کامل را جست‌وجو می‌کنم پیدایش نمی‌کند!

افشین فلاطونی

unread,
Apr 16, 2012, 11:51:29 AM4/16/12
to Behnam Esfahbod, Mehrdad Senobari, persian-co...@googlegroups.com

من یک فایل PDF ضمیمه کرده‌ام که با استفاده از همین گزینه اصطلاحاً Tag دار شده است.

سه کلمه فارسی در این فایل هست و فایل را هم در برنامه Evince تحت لینوکس باز کردم. زمانی که فقط یک حرف را جست‌وجو می‌کنم آن حرف را بدون مشکل پیدا می‌کند اما وقتی یک کلمه کامل را جست‌وجو می‌کنم پیدایش نمی‌کند!


On 03/06/12 07:05, Behnam Esfahbod wrote:
test.pdf

Javad

unread,
Apr 17, 2012, 1:31:44 AM4/17/12
to fala...@gmail.com, Behnam Esfahbod, Mehrdad Senobari, persian-co...@googlegroups.com
در evince برای جستجوی کلمات فارسی باید آن را به صورت معکوس بنویسید مثلا اگر به دنبال «می شود» هستید باید بنویسید «دوش یم».

2012/4/16 افشین فلاطونی <fala...@gmail.com>

افشین فلاطونی

unread,
Apr 17, 2012, 9:07:34 AM4/17/12
to Javad, persian-co...@googlegroups.com, Mehrdad Senobari

حق با شما است. این‌طوری پیدا می‌شود.

اما کلاً روش مناسبی برای جست‌وجو نیست؛ خصوصاً وقتی که قرار است دنبال چندین کلمه در فایل بگردید.

متشکرم.

Amir Farsi

unread,
Oct 24, 2014, 4:56:49 PM10/24/14
to persian-co...@googlegroups.com, fala...@gmail.com, beh...@esfahbod.info, seno...@gmail.com
فکر میکنم نرم افزارهای Adobe شامل Acrobat و Reader که مردم به اشتباه آنها را یکی مپندارند! توانایی تشخیص زبانهای از راست به چپ را بخوبی ندارند و به همین علت هنگام جستجوی کلمات فارسی باید برعکس نوشت. البته اطمینان ندارم. چون فکر کنم جستجوی متون عربی را به راحتی انجام میدهند. البته نسخه ME یا همان خاورمیانه محصولات ادوبی مشکل کمتری دارند. البته در نسخه های جدید محصولات ادوبی نسخه اختصاصی خاورمیانه وجود ندارد و همان نرم افزار میتواند از زبانهای از راست به چپ نیز پشتیبانی کند.

در سه‌شنبه 17 آوریل 2012، ساعت 10:01:44 (UTC+4:30)، Seiied Mohammad Javad Razavian نوشته:

Saleh Souzanchi

unread,
Oct 25, 2014, 10:30:10 AM10/25/14
to persian-co...@googlegroups.com, fala...@gmail.com
درود بر شما
به طور کلی دو دلیل میتونه داشته باشه.:
۱- استفاده از ویرایشگرهای غیر استاندارد. که استاندارد ینیکد را رعایت نمیکنند.
۲- زمانی که هنگام ایجاد پی دی اف گزینه embeded fonts رو فعال کرده باشند و اون فونت هم بر اساس استاندارد ینیکد پیاده ازی نشده باشد  امکان سرچ کردن از بین میره.

Behdad Esfahbod

unread,
Oct 25, 2014, 9:37:15 PM10/25/14
to Saleh Souzanchi, persian-co...@googlegroups.com, fala...@gmail.com
On 14-10-25 07:30 AM, Saleh Souzanchi wrote:
> درود بر شما
> به طور کلی دو دلیل میتونه داشته باشه.:
> ۱- استفاده از ویرایشگرهای غیر استاندارد. که استاندارد ینیکد را رعایت نمیکنند.
> ۲- زمانی که هنگام ایجاد پی دی اف گزینه embeded fonts رو فعال کرده باشند و اون
> فونت هم بر اساس استاندارد ینیکد پیاده ازی نشده باشد امکان سرچ کردن از بین میره.

والا کاش به این سادگی بود صالح جان :)))).‏ درست پی‌دی‌اف ساختن بسیار غیر
بدیهیه از این نظر. اگه علاقه داری، اینجا یکم می‌تونی بخونی:‏

http://lists.cairographics.org/archives/cairo/2007-February/009452.html

http://lists.cairographics.org/archives/cairo/2007-September/011427.html

بهداد
--
behdad
http://behdad.org/

Amir Farsi

unread,
Oct 31, 2014, 11:47:04 AM10/31/14
to persian-co...@googlegroups.com, fala...@gmail.com
یکی از مشکلات pdf این است که متن باز نیست یا جداقل بخشی از کدهای اون در اختیار ادوبی است. فکر کنم برای حل بنیادین مشکل، باید ادوبی کدهای زیربنایی اون رو اصلاح کنه، یا حداقل نرم افزارهای Acrobat و Reader را. آیا حدس من درست است؟
راستی وضعیت xps و open xps و epub چگونه است؟
وضعیت در فایلهای .mobi و .azw که مربوط به کتابخوان آمازون است، بدتر از pdf است.

 
 
 
 

Behdad Esfahbod

unread,
Oct 31, 2014, 4:31:36 PM10/31/14
to Amir Farsi, persian-co...@googlegroups.com, fala...@gmail.com
On 14-10-31 08:47 AM, Amir Farsi wrote:
> یکی از مشکلات pdf این است که متن باز نیست

اشتباه. پی‌دی‌اف یک قالب فایل هست که مستندات آن در دسترس همه است.‏ «متن‌باز»
در این حیطه معنی نمی‌دهد. یا حداقل اون معنی که شما فکر می‌کنید نمی‌دهد.‏

--
behdad
http://behdad.org/

mahdi safari

unread,
Apr 8, 2021, 5:24:51 PM4/8/21
to محاسبات فارسی
ولی امکان سرچ فارسی در کروم وجود نداره برای من .دلیلش چی میتونه باشه

Mojtaba Ghasemnataj

unread,
Jun 14, 2021, 2:11:50 PM6/14/21
to محاسبات فارسی

بهترین راه اینه که فایل رو تبدیل به ورد کنیم .
به شما این سایت ایرانی رو پیشنهاد میکنم 
خیلی خوب تبدیل رو انجام میده
Reply all
Reply to author
Forward
0 new messages