ژیکو

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

ژیکو

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

دانلود تحقیق درباره هوش مصنوع (با فرمت word)

اختصاصی از ژیکو دانلود تحقیق درباره هوش مصنوع (با فرمت word) دانلود با لینک مستقیم و پر سرعت .

لینک دانلود و خرید پایین توضیحات

فرمت فایل word  و قابل ویرایش و پرینت

تعداد صفحات: 40

 

مقدمه

 « هوش مصنوعی، دانش ساختن ماشین‌‌ ها یا برنامه‌های هوشمند است. »

 

   همانگونه که از تعریف فوق-که توسط یکی از بنیانگذاران هوش مصنوعی ارائه شده است- برمی‌آید،حداقل به دو سؤال باید پاسخ داد:1ـ هوشمندی چیست؟2ـ برنامه‌های هوشمند، چه نوعی از برنامه‌ها هستند؟

تعریف دیگری که از هوش مصنوعی می‌توان ارائه داد به قرار زیر است:   « هوش مصنوعی، شاخه‌ایست از علم کامپیوتر که ملزومات محاسباتی اعمالی همچون ادراک (Perception)، استدلال(reasoning) و یادگیری(learning) را بررسی کرده و سیستمی جهت انجام چنین اعمالی ارائه می‌دهد.»

و در نهایت تعریف سوم هوش مصنوعی از قرار زیر است:   «هوش مصنوعی، مطالعه روش‌هایی است برای تبدیل کامپیوتر به ماشینی که بتواند اعمال انجام شده توسط انسان را انجام دهد.»

   به این ترتیب می‌توان دید که دو تعریف آخر کاملاً دو چیز را در تعریف نخست واضح کرده‌اند.1ـ منظور از موجود یا ماشین هوشمند چیزی است شبیه انسان.2ـ ابزار یا ماشینی که قرار است محمل هوشمندی باشد یا به انسان شبیه شود، کامپیوتر است.

   هر دوی این نکات کماکان مبهم و قابل پرسشند. آیا تنها این نکته که هوشمندترین موجودی که می‌شناسیم، انسان است کافی است تا هوشمندی را به تمامی اعمال انسان نسبت دهیم؟ حداقل این نکته کاملاً واضح است که بعضی جنبه‌های ادراک انسان همچون دیدن و شنیدن کاملاً ضعیف‌تر از موجودات دیگر است.

   علاوه بر این، کامپیوترهای امروزی با روش‌هایی کاملاً مکانیکی(منطقی) توانسته‌اند در برخی جنبه‌های استدلال، فراتر از توانایی‌های انسان عمل کنند.

   بدین ترتیب، آیا می‌توان در همین نقطه ادعا کرد که هوش مصنوعی تنها نوعی دغدغه علمی یا کنجکاوی دانشمندانه است و قابلیت تعمق مهندسی ندارد؟(زیرا اگر مهندسی، یافتن روش‌های بهینه انجام امور باشد، به هیچ رو مشخص نیست که انسان اعمال خویش را به گونه‌ای بهینه انجام می‌دهد). به این نکته نیز باز خواهیم گشت.   اما همین سؤال را می‌توان از سویی دیگر نیز مطرح ساخت، چگونه می‌توان یقین حاصل کرد که کامپیوترهای امروزین، بهترین ابزارهای پیاده‌سازی هوشمندی هستند؟

   رؤیای طراحان اولیه کامپیوتر از بابیج تا تورینگ، ساختن ماشینی بود که قادر به حل تمامی  مسائل باشد، البته ماشینی که در نهایت ساخته شد(کامپیوتر) به جز دسته ای خاص از مسائل قادر به حل تمامی مسائل بود. اما نکته در اینجاست که این «تمامی مسائل» چیست؟ طبیعتاً چون طراحان اولیه کامپیوتر، منطق‌دانان و ریاضیدانان بودند، منظورشان تمامی مسائل منطقی یا محاسباتی بود. بدین ترتیب عجیب نیست، هنگامی که فون‌نیومان سازنده اولین کامپیوتر، در حال طراحی این ماشین بود، کماکان اعتقاد داشت برای داشتن هوشمندی شبیه به انسان، کلید اصلی، منطق(از نوع به کار رفته در کامپیوتر) نیست، بلکه احتمالاً چیزی خواهد بود شبیه ترمودینامیک!

       به هرحال، کامپیوتر تا به حال به چنان درجه‌ای از پیشرفت رسیده و چنان سرمایه‌گذاری عظیمی برروی این ماشین انجام شده است که به فرض این که بهترین انتخاب نباشد هم، حداقل سهل‌الوصول‌ترین و ارزان‌ترین و عمومی‌ترین انتخاب برای پیاده‌سازی هوشمندیست.

   بنابراین ظاهراً به نظر می‌رسد به جای سرمایه‌گذاری برای ساخت ماشین‌های دیگر هوشمند، می‌توان از کامپیوترهای موجود برای پیاده‌سازی برنامه‌های هوشمند استفاده کرد و اگر چنین شود، باید گفت که طبیعت هوشمندی ایجاد شده حداقل از لحاظ پیاده‌سازی، کاملاً با طبیعت هوشمندی انسانی متناسب خواهد بود، زیرا هوشمندی انسانی، نوعی هوشمندی بیولوژیک است که با استفاده از مکانیسم‌های طبیعی ایجاد شده، و نه استفاده از عناصر و مدارهای منطقی.

 

  فون نیومن آلن تورینگ

در برابر تمامی استدلالات فوق می توان این نکته را مورد تاُمل و پرسش قرار داد که هوشمندی طبیعی تا بدان جایی که ما سراغ داریم، تنها برمحمل طبیعی و با استفاده از روش های طبیعت ایجاد شده است. طرفداران این دیدگاه تا بدانجا پیش رفته‌اند که حتی ماده ایجاد کننده هوشمندی را مورد پرسش قرار داده اند، کامپیوتر از سیلیکون استفاده می کند، در حالی که طبیعت همه جا از کربن سود برده است.

   مهم تر از همه، این نکته است که در کامپیوتر، یک واحد کاملاً پیچیده مسئولیت انجام کلیه اعمال هوشمندانه را بعهده دارد، در حالی که طبیعت در سمت و سویی کاملاً مخالف حرکت کرده است. تعداد بسیار زیادی از واحدهای کاملاً ساده (بعنوان مثال از نورون‌های شبکه عصبی) با عملکرد همزمان خود (موازی) رفتار هوشمند را سبب می شوند. بنابراین تقابل هوشمندی مصنوعی و هوشمندی طبیعی حداقل در حال حاضر تقابل پیچیدگی فوق العاده و سادگی فوق العاده است. این مساُله هم اکنون کاملاً به صورت یک جنجال(debate) علمی در جریان است.

   در هر حال حتی اگر بپذیریم که کامپیوتر در نهایت ماشین هوشمند مورد نظر ما نیست، مجبوریم برای شبیه‌سازی هر روش یا ماشین دیگری از آن سود بجوییم.

تاریخ هوش مصنوعی

   هوش مصنوعی به خودی خود علمی است کاملاً جوان. در واقع بسیاری شروع هوش مصنوعی را 1950 می‌ دانند زمانی که آلن تورینگ مقاله دوران‌ساز خود را در باب چگونگی ساخت ماشین هوشمند نوشت (آنچه بعدها به تست تورینگ مشهور شد) تورینگ درآن مقاله یک روش را برای تشخیص هوشمندی پیشنهاد می‌کرد. این روش بیشتر به یک بازی شبیه بود.

 

  فرض کنید شما در یک سمت یک دیوار (پرده یا هر مانع دیگر) هستید و به صورت تله تایپ باآن سوی دیوار ارتباط دارید و  شخصی از آن سوی دیوار از این طریق با شما در تماس است. طبیعتاً یک مکالمه بین شما و شخص آن سوی دیوار می‌تواند صورت پذیرد. حال اگر پس از پایان این مکالمه، به شما گفته شود که آن سوی دیوار نه یک شخص بلکه (شما کاملاً از هویت شخص آن سوی دیوار بی‌خبرید) یک ماشین بوده که پاسخ شما را می‌داده، آن ماشین یک ماشین هوشمند خواهد بود، در غیر این صورت(یعنی در صورتی که شما در وسط مکالمه به مصنوعی بودن پاسخ پی ببرید) ماشین آن سوی دیوار هوشمند نیست و موفق به گذراندن تست تورینگ نشده است.

   باید دقت کرد که تورینگ به دو دلیل کاملاً مهم این نوع از ارتباط(ارتباط متنی به جای صوت) را انتخاب کرد. اول این که موضوع ادراکی صوت را کاملاً از صورت مساُله حذف کند و این تست هوشمندی را درگیر مباحث مربوط به دریافت و پردازش صوت نکند و دوم این که بر جهت دیگری هوش مصنوعی به سمت نوعی از پردازش زبان طبیعی تاکید کند.

   در هر حال هر چند تاکنون تلاش‌های متعددی در جهت پیاده سازی تست تورینگ صورت گرفته مانند برنامه Eliza و یا  AIML   (زبانی برای نوشتن برنامه‌‌‌‌هایی که قادر به chat کردن اتوماتیک باشند) اما هنوز هیچ ماشینی موفق به گذر از چنین تستی نشده است.

   همانگونه که مشخص است، این تست نیز کماکان دو پیش فرض اساسی را در بردارد:1ـ نمونه کامل هوشمندی انسان است.2ـ مهمترین مشخصه هوشمندی توانایی پردازش و درک زبان طبیعی است.


دانلود با لینک مستقیم


دانلود تحقیق درباره هوش مصنوع (با فرمت word)

مقاله درباره پرورش شتر مرغ

اختصاصی از ژیکو مقاله درباره پرورش شتر مرغ دانلود با لینک مستقیم و پر سرعت .

مقاله درباره پرورش شتر مرغ


مقاله درباره پرورش شتر مرغ

لینک پرداخت و دانلود در "پایین مطلب"

 فرمت فایل: word (قابل ویرایش و آماده پرینت)

 تعداد صفحات:20

پرورش شتر مرغ

مطابق جدول زمانی ارائه شده با خرید 2 قطعه شتر مرغ نر و 5 قطعه شتر مرغ ماده و خرید 10 قطعه شتر مرغ یک ساله و خرید 125 تخم شتر مرغ فعالیت پرورشی شروع شده و در سال اول تعداد شتر مرغ های مولد را افزایش می دهیم تا بتوانیم ظرفیت مزرعه را به 200 قطعه برسانیم ، که در نهایت در پایان سال پنجم مزرعه به ظرفیت کامل می رسد .

پرورش شتر مرغ دارای مراحلی به قرار زیر است :

  • خرید شتر مرغ های مولد و یکساله و تخم تشر مرغ
  • ایجاد تأسیسات و ساختانهای جهت نگهداری شتر مرغ
  • ایجاد مزرعه شتر مرغ جهت تغذیه شتر مرغ ها

 

1- شتر مرغ های خریداری شده برای شروع کار :

ردیف

نوع شتر مرغ ها

تعداد

1

شتر مرغ بالغ نر

2

2

شتر مرغ بالغ ماده

5

3

شتر مرغ یکساله

10

4

تخم شتر مرغ

125

 

 

سال شروع (1384 )

با توجه به 5 ماده مولد خریداری شده که هر کدام 60 عدد تخم می گذارند و 125 عدد تخم شتر مرغ خریداری شده و همچنین در نظر گرفتن 60 الی 70 درصد قدرت باروری ، متوسط 85 درصد و 20 درصد تلفات جوجه ، 324 جوجه خواهیم داشت که از این تعداد 160 عدد جوجه ماده و 160 عدد جوجه نر می باشند .

پایان سال 1384

در پایان سال 1384 تعداد شتر مرغ ها بر اساس جدول زیر می باشد .

ردیف

نوع شتر مرغ ها

تعداد

1

شتر مرغ بالغ نر

2

2

شتر مرغ بالغ ماده

5

3

شتر مرغ یکساله

290

4

جوجه یکروزه

300

 

فروش از سال 1384

با توجه به تولید و جهت بدست آوردن قسمتی از سرمایه گذاری مطابق جدول فروش زیر را خواهیم داشت .

ردیف

نوع

کل

جهت فروش

باقی مانده

1

جوجه یکروزه

300

200 قطعه

100 قطعه

2

شتر مرغ یک ساله

290

250 قطعه

40 قطعه

سال اول 1385

تعداد بالغین ما با توجه به خریداری 7 قطعه شتر مرغ بالغ در سال قبل و خریداری 1 قطعه شتر مرغ نر و 4 قطعه شتر مرغ ماده ، تعداد شتر مرغ های بالغ در این سال به 12 قطعه خواهد رسسید (3 قطعه نر و 9 قطعه ماده ) که با این شرایط تا پایان سال 1385 انتظار تولید زیر را خواهیم داشت .

پایان سال 1385

تعداد شتر مرغ ها بر اساس جداول زیر می باشد .

ردیف

نوع شتر مرغ ها

تعداد

1

شتر مرغ بالغ نر

3

2

شتر مرغ بالغ ماده

9

3

شتر مرغ یکساله

100

4

جوجه یک روزه

540

 

فروش از سال 1385

با توجه به تولید و جهت به دست آوردن قسمتی از سرمایه گذاری مطابق جدول فروش زیر را خواهیم داشت . 

ردیف

نوع

کل

جهت فروش

باقی مانده

1

جوجه یکروزه

540

400 قطعه

140 قطعه

2

شتر مرغ یک ساله

100

50 قطعه

50 قطعه


دانلود با لینک مستقیم


مقاله درباره پرورش شتر مرغ

پاورپوینت سفرنامه ها

اختصاصی از ژیکو پاورپوینت سفرنامه ها دانلود با لینک مستقیم و پر سرعت .

پاورپوینت سفرنامه ها


پاورپوینت سفرنامه ها

لینک پرداخت و دانلود *پایین مطلب*

 فرمت فایل:powerpoint (قابل ویرایش و آماده پرینت)

  تعداد اسلاید:103

فهرست:
n1.سفرنامه جکسن
n2.سفرنامه هانری بایندر
n3.سفرنامه ناصرخسرو
nمقدمه :
n
nسفرنامه‌ها گرچه از منابع جغرافیایی محسوب می‌شوند، اما حامل اطلاعات تاریخی درخصوص جوامع بشری هستند. برای سفرنامه‌ها گذشته از ارزش تاریخی، به‌عنوان آثاری که منشأ یا دست کم تسریع کننده تحولات اجتماعی و فرهنگی شده‌اند، نیز نقش قائل هستند. به آسانی می‌توان تصور کرد که اگر فناوری حمل و نقل، مسافرت را سهل و ساده نکرده بود؛ و فناوری ارتباطات، به‌ویژه سینما و تلویزیون، مشاهده سرزمین‌ها و مردمان دیگر را به تجربه‌ای روزمره و همگانی تبدیل نکرده بود، سفرنامه‌ها به‌عنوان تنها منبع اطلاعات دست اول از سرزمین‌ها و مردمان دیگر، اهمیت بسیاری داشتند.
n
nسفرنامه، نوعی گزارش است که نویسنده در قالب آن مشاهدات خود را از اوضاع شهرها یا سرزمینهایی که بدان مسافرت کرده است شرح می دهد و اطلاعاتی از بناهای تاریخی، مساجد، کتابخانه ها، بازارها، بزرگان، آداب و رسوم ملی و مذهبی مردم، موقعیت جغرافیایی، جمعیت، آب و هوا، زبان اهالی، مناطقی که بازدید نموده است در اختیار خواننده می گذارد.
n
n
nسفرنامه ها گنجینه ای از اطلاعات هستند که از طریق آنها گاه می توان به واقعیتهایی از وضع اجتماعی، سیاسی، اقتصادی ادواری از تاریخ مردم یا منطقه ای پی برد که دست یابی به آنها از طریق کتب تاریخی میسر نیست.
n
nسفرنامه ها بسته به آن که مسافرت نویسنده از نوع سفرها و سیاحتهای معمول و گردش در آفاق و انفس باشد، یا سیری درونی و معنوی، به دو نوع ذیل تقسیم می شود:
n
سفرنامه های خیالی 
n
این گونه از سفرنامه ها که اغلب به صورت قصه یا تمثیل بیان می شود، گزارشی از ذهنیات نویسنده است درباره امری باطنی و اعتقادی، نظیر آثاری چون کتاب اردا ویرافنامه، که موضوع آن سفر معنوی یا معراجی است که برای ارداویراف، مؤبد فرزانه زردشتی- معاصر اردشیر بابکان (224-241 م) پیش می آید و او ضمن این سیاحت روحانی، از جهنم و بهشت دیدار می کند و مشاهدات خود را بر اساس اعتقادات دین زردشت به رشته تحریر می کشد
n
nسفرنامه های واقعی
n
n
محتوای این نوع از سفرنامه ها، شرح مسافرتهایی است که واقعاً عملی شده است و نویسندگان خاطرات خود و رخدادهایی را که در جریان سفر عیناً دیده و شنیده و با آنها مواجه شده اند، به رشته تحریر درآورده اند.
nنظیر سفرنامه ناصر خسرو قبادیانی که شرح مسیر سفر دو هزار و دویست فرسنگی است از بلخ تا مصر، که از راه مرو و نیشابور و سمنان و ری و قزوین و آذربایجان و آسیای صغیر و شام و فلسطین و حجاز تا قاهره پایتخت مصر انجام می گیرد، همچنین مسیر برگشت اوست از این سفر که پس از آخرین زیارتش از خانه خدا در سال 442 هجری از راه طائف و یمن و لحساء و بصره و فارس و اصفهان به بلخ مراجعت می کند و جمعاً مدت هفت سال (از 437 تا 444 هجری) طول می کشد
در این اثر که ناصر خسرو آن را با انشایی روان و دل انگیز نگاشته است، اطلاعات دقیق و ارزشمندی را از اوضاع جغرافیایی وبناهای تاریخی و آداب و رسوم مردم شهرهای مسیر مسافرت خود به دست می دهد
 

دانلود با لینک مستقیم


پاورپوینت سفرنامه ها

پروژه و تحقیق-علم داده کاوی و کاربرد آن در نرم افزار و it- در100 صفحه-docx

اختصاصی از ژیکو پروژه و تحقیق-علم داده کاوی و کاربرد آن در نرم افزار و it- در100 صفحه-docx دانلود با لینک مستقیم و پر سرعت .

پروژه و تحقیق-علم داده کاوی و کاربرد آن در نرم افزار و it- در100 صفحه-docx


پروژه و تحقیق-علم داده کاوی  و کاربرد آن در نرم افزار و it- در100 صفحه-docx

داده‌کاوی، پایگاه‌ها و مجموعه‌ حجیم داده‌ها را در پی کشف و استخراج، مورد تحلیل قرار می‌دهد. این گونه مطالعات و کاوش‌ها را به واقع می‌توان همان امتداد و استمرار دانش کهن و همه جا گیر آمار دانست. تفاوت عمده در مقیاس، وسعت و گوناگونی زمینه‌ها و کاربردها، و نیز ابعاد و اندازه‌های داده‌های امروزین است که شیوه‌های ماشینی مربوط به یادگیری، مدل‌سازی، و آموزش را طلب می‌نماید.

در سال ۱۹۶۰ آماردانان اصطلاح "Data Fishing" یا "Data Dredging"به معنای "صید داده" را جهت کشف هر گونه ارتباط در حجم بسیار بزرگی از داده‌ها بدون در نظر گرفتن هیچگونه پیش فرضی بکار بردند. بعد از سی سال و با انباشته شدن داده‌ها در پایگاه داده اصطلاح داده کاوی در حدود سال ۱۹۹۰ رواج بیشتری یافت. اصطلاحات دیگری نظیر "Data Archaeology"یا "Information Harvestingg" یا "Information Discovery" یا"Knowledge Extractionn" نیز بکار رفته‌اند.

 

مقدمه

بسیاری از شرکت‌ها و موسسات دارای حجم انبوهی از اطلاعات هستند. تکنیک‌های داده‌کاوی به طور تاریخی به گونه‌ای گسترش یافته‌اند که به سادگی می‌توان آنها را بر ابزارهای نرم‌افزاری و ... امروزی تطبیق داده و از اطلاعات جمع‌آوری شده بهترین بهره را برد.

در صورتی که سیستم‌های داده‌کاوی بر روی سکوهای Client/Server قوی نصب شده باشد و دسترسی به بانک‌های اطلاعاتی بزرگ فراهم باشد، می‌توان به سوالاتی از قبیل :کدامیک از مشتریان  ممکن است خریدار کدامیک از محصولات آینده شرکت باشند، چرا، در کدام مقطع زمانی و بسیاری از موارد مشابه پاسخ داد.

ویژگی‌ها

یکی از ویژگیهای کلیدی در بسیاری از ابتکارات مربوط به تامین امنیت ملی، داده کاوی است. داده کاوی که به عنوان ابزاری برای کشف جرایم، ارزیابی میزان ریسک و فروش محصولات به کار می‌رود، در بر گیرنده ابزارهای تجزیه و تحلیل اطلاعات به منظور کشف الگوهای معتبر و ناشناخته در بین انبوهی از داده هاست. داده کاوی غالباً در زمینه تامین امنیت ملی به منزله ابزاری برای شناسایی فعالیت‌های افراد خرابکار شامل جابه جایی پول و ارتباطات بین آنها و همچنین شناسایی و ردگیری خود آنها با بررسی سوابق مربوط به مهاجرت و مسافرت هاست.

داده کاوی پیشرفت قابل ملاحظه‌ای را در نوع ابزارهای تحلیل موجود نشان می‌دهد اما محدودیت‌هایی نیز دارد. یکی از این محدودیت‌ها این است که با وجود اینکه به آشکارسازی الگوها و روابط کمک می‌کند اما اطلاعاتی را درباره ارزش یا میزان اهمیت آنها به دست نمی‌دهد. دومین محدودیت آن این است که با وجود توانایی شناسایی روابط بین رفتارها و یا متغیرها لزوماً قادر به کشف روابط علت و معلولی نیست. موفقیت داده کاوی در گرو بهره‌گیری از کارشناسان فنی و تحلیل گران کار آزموده‌ای است که از توانایی کافی برای طبقه‌بندی تحلیل‌ها و تغییر آنها برخوردار هستند.

بهره‌برداری از داده کاوی در دو بخش دولتی و بخش خصوصی رو به گسترش است.[۱] صنایعی چون بانکداری، بیمه، بهداشت و بازاریابی آنرا عموماً برای کاهش هزینه‌ها، ارتقاء کیفی پژوهش‌ها و بالاتر  بردن میزان فروش به کار می‌برند. کاربرد اصلی داده کاوی در بخش دولتی به عنوان ابزاری برای تشخیص جرایم بوده‌است اما امروزه دامنه بهره‌برداری از آن گسترش روزافزونی یافته و سنجش وبهینه‌سازی برنامه‌ها را نیز در بر می‌گیرد. بررسی برخی از برنامه‌های کاربردی مربوط به داده کاوی که برای تامین امنیت ملی به کار می‌روند، نشان دهنده رشد قابل ملاحظه‌ای در رابطه با کمیت و  دامنه داده‌هایی است که باید تجزیه و تحلیل شوند.

توانایی‌های فنی در داده کاوی از اهمیت ویژه‌ای برخوردار اند اما عوامل دیگری نیز مانند چگونگی پیاده‌سازی و نظارت ممکن است نتیجه کار را تحت تأثیر قرار دهند. یکی از این عوامل کیفیت داده هاست که بر میزان دقت و کامل بودن آن دلالت دارد. عامل دوم میزان سازگاری نرم‌افزار داده کاوی با بانکهای اطلاعاتی است که از سوی شرکت‌های متفاوتی عرضه می‌شوند. عامل سومی که باید به آن اشاره کرد به بیراهه رفتن داده کاوی و بهره‌برداری از داده‌ها به منظوری است که در ابتدا با این نیت گرد آوری نشده‌اند. حفظ حریم خصوصی افراد عامل دیگری است که باید به آن توجه داشت.

اصولاً به پرسش‌های زیر در زمینه داده کاوی باید پاسخ داده شود:

  • سازمانهای دولتی تا چه حدی مجاز به بهره‌برداری از داده‌ها هستند؟
  • آیا از داده‌ها در چارچوبی غیر متعارف بهره‌برداری می‌شود؟
  • کدام قوانین حفظ حریم خصوصی ممکن است به داده کاوی مربوط شوند؟

کاوش در داده‌ها بخشی بزرگ از سامانه‌های هوشمند است. سامانه‌های هوشمند زیر شاخه‌ای بزرگ و پرکاربرد از زمینه علمی جدید و پهناور یادگیری ماشینی هستند که خود زمینه‌ای در هوش مصنوعی است. فرایند گروه گروه کردن مجموعه‌ای از اشیاء فیزیکی یا مجرد به صورت طبقه‌هایی از اشیاء مشابه هم را خوشه‌بندی می‌نامیم.

با توجه به اندازه‌های گوناگون (و در اغلب کاربردها بسیار بزرگ و پیچیده) مجموعه‌های داده‌ها مقیاس‌پذیری الگوریتم‌های به کار رفته معیاری مهم در مفاهیم مربوط به کاوش در داده‌ها است.

کاوش‌های ماشینی در متون حالتی خاص از زمینهٔ عمومی‌تر کاوش در داده‌ها بوده، و به آن دسته از کاوش‌ها اطلاق می‌شود که در آن‌ها داده‌های مورد مطالعه از جنس متون نوشته شده به زبان‌های طبیعی انسانی باشد.

چیستی

داده کاوی به بهره‌گیری از ابزارهای تجزیه و تحلیل داده‌ها به منظور کشف الگوها و روابط معتبری که تا کنون ناشناخته بوده‌اند اطلاق می‌شود. این ابزارها ممکن است مدلهای آماری، الگوریتم‌های ریاضی و روش‌های یاد گیرنده (Machine Learning Methods) باشند که کار این خود را به صورت خودکار و بر اساس تجربه‌ای که از طریق شبکه‌های عصبی (Neural Networks) یا درخت‌های تصمیم گیری (Decision Trees) به دست می‌آورند بهبود می‌بخشد. داده کاوی منحصر به گردآوری و مدیریت داده‌ها نبوده و تجزیه و تحلیل اطلاعات و پیش بینی را نیز شامل می‌شود برنامه‌های کاربردی که با بررسی فایل‌های متن یا چند رسانه‌ای به کاوش داده‌ها می‌پردازند پارامترهای گوناگونی را در نظر می‌گیرد که عبارت اند از:

  • قواعد انجمنی (Association): الگوهایی که بر اساس آن یک رویداد به دیگری مربوط می‌شود مثلاً خرید قلم به خرید کاغذ.
  • ترتیب (Sequence): الگویی که به تجزیه و تحلیل توالی رویدادها پرداخته و مشخص می‌کند کدام رویداد، رویدادهای دیگری را در پی دارد مثلاً تولد یک نوزاد و خرید پوشک.
  • پیش بینی(Prediction): در پیش بینی هدف پیش بینی یک متغیر پیوسته می‌باشد. مانند پیش بینی نرخ ارز یا هزینه‌های درمانی.
  • رده‌بندی یا طبقه‌بندی (Classification): فرایندی برای پیدا کردن مدلی است که رده‌های موجود در داده‌ها را تعریف می‌نماید و متمایز می‌کند، با این هدف که بتوان از این مدل برای پیش بینی رده رکوردهایی که برچسب رده آنها (متغیر هدف) ناشناخته می‌باشد، استفاده نمود.[۲]در حقیقت در رده‌بندی بر خلاف پیش بینی، هدف پیش بینی مقدار یک متغیر گسسته است. روش‌های مورد  استفاده در پیش بینی و رده‌بندی عموماً یکسان هستند.
  • خوشه‌بندی(Clustering): گروه بندی مجموعه‌ای از اعضاء، رکوردها یا اشیاء به نحوی که اعضای موجود در یک خوشه بیشترین شباهت را به یکدیگر و کمترین شباهت را به اعضای خوشه‌های دیگر داشته باشند
  • مصورسازی (visualization): مصورسازی داده‌ها یکی از قدرتمندترین و جذابترین روش‌های اکتشاف در داده‌ها می‌باشد.

برنامه‌های کاربردی که در زمینه تجزیه و تحلیل اطلاعات به کار می‌روند از امکاناتی چون پرس و جوی ساخت یافته (Structured query) که در بسیاری از بانک‌های اطلاعاتی یافت می‌شود و از ابزارهای  تجزیه و تحلیل آماری برخوردارند اما برنامه‌های مربوط به داده کاوی در عین برخورداری از این قابلیت‌ها از نظر نوع با آنها تفاوت دارند. بسیاری از ابزارهای ساده برای تجزیه و تحلیل داده‌ها روشی بر پایه راستی آزمایی (verification) را به کار می‌برند که در آن فرضیه‌ای بسط داده شده آنگاه داده‌ها برای تایید یا رد آن بررسی می‌شوند. به طور مثال ممکن است این نظریه مطرح شود که فردی که یک چکش خریده حتماً یک بسته میخ هم خواهد خرید. کارایی این روش به میزان خلاقیت کاربر برای ارایه فرضیه‌های متنوع و همچنین ساختار برنامه بکار رفته بستگی دارد. در مقابل در داده کاوی روشهایی برای کشف روابط بکار برده می‌شوند و به کمک الگوریتم‌هایی روابط چند بعدی بین داده‌ها تشخیص داده شده و آنهایی که یکتا (unique) یا رایج هستند شناسایی می‌شوند. به طور مثال در یک فروشگاه سخت‌افزار ممکن است بین خرید ابزار توسط مشتریان با تملک خانه شخصی یا نوع خودرو، سن، شغل، میزان درآمد یا فاصله محل اقامت آنها با فروشگاه رابطه‌ای برقرار شود.

در نتیجه قابلیت‌های پیچیده‌اش برای موفقیت در تمرین داده کاوی دو مقدمه مهم است یکی فرمول واضحی از مشکل که قابل حل باشد و دیگری دسترسی به داده متناسب. بعضی از ناظران داده کاوی را مرحله‌ای در روند کشف دانش در پایگاه داده‌ها می‌دانند (KDD). مراحل دیگری در روند KDDD به صورت تصاعدی شامل، پاکسازی داده، انتخاب داده انتقال داده، داده کاوی، الگوی ارزیابی، و عرضه  دانش می‌باشد. بسیاری از پیشرفت‌ها در تکنولوژی و فرایندهای تجاری بر رشد علاقه‌مندی به داده کاوی در بخش‌های خصوصی و عمومی سهمی داشته‌اند. بعضی از این تغییرات شامل:

  • رشدشبکه‌های کامپیوتری که در ارتباط برقرار کردن پایگاهها داده مورد استفاده قرار می‌گیرند.
  • توسعه افزایش تکنیکهایی بر پایه جستجو مثل شبکه‌های عصبی و الگوریتم‌های پیشرفته.
  • گسترش مدل محاسبه کلاینت سروری که به کاربران اجازه دسترسی به منابع داده‌های متمرکز شده را از روی دسک تاپ می‌دهد.
  • و افزایش توانایی به تلفیق داده از منابع غیر متجانس به یک منبع قابل جستجو می‌باشد.

علاوه بر پیشرفت ابزارهای مدیریت داده، افزایش قابلیت دسترسی به داده و کاهش نرخ نگهداری داده نقش ایفا می‌کند. در طول چند سال گذشته افزایش سریع جمع‌آوری و نگه داری حجم اطلاعات وجود داشته‌است. با پیشنهادهای برخی از ناظران مبنی بر آنکه کمیت داده‌های دنیا به طور تخمینی هر ساله دوبرابر می‌گردد. در همین زمان هزینه ذخیره‌سازی داده‌ها بطور قابل توجهی از دلار برای هر مگابایت به پنی برای مگابایت کاهش پیدا کرده‌است. مطابقاً قدرت محاسبه‌ها در هر ۱۸ ۲۴ ماه به دوبرابر ارتقاء پیدا کرده‌است این در حالی است که هزینه قدرت محاسبه رو به کاهش است. داده کاوی به طور معمول در دو حوزه خصوصی و عمومی افزایش پیدا کرده‌است. سازمانها داده کاوی را به عنوان ابزاری برای بازدید اطلاعات مشتریان کاهش تقلب و اتلاف و کمک به تحقیقات پزشکی استفاده می‌کنند. با اینهمه ازدیاد داده کاوی به طبع بعضی از پیاده‌سازی و پیامد اشتباه را هم دارد. اینها شامل نگرانی‌هایی در مورد کیفیت داده‌ای که تحلیل می‌گردد، توانایی کار گروهی پایگاههای داده و نرم‌افزارها بین ارگانها و تخطی‌های بالقوه به حریم شخصی می‌باشد. همچنین ملاحظاتی در مورد محدودیتهایی در داده کاوی در ارگان‌ها که کارشان تاثیر بر امنیت دارد، نادیده گرفته می‌شود.

محدودیت‌های داده کاوی

در حالیکه محصولات داده کاوی ابزارهای قدرتمندی می‌باشند، اما در نوع کاربردی کافی نیستند. برای کسب موفقیت، داده کاوی نیازمند تحلیل گران حرفه‌ای و متخصصان ماهری می‌باشد که بتوانند ترکیب خر


دانلود با لینک مستقیم


پروژه و تحقیق-علم داده کاوی و کاربرد آن در نرم افزار و it- در100 صفحه-docx