EngineersRepository

Repository of notes and books for computer engineers

نگاهی به تفاوت بین داده کاوی (data mining) و انباره داده (data warehouse)

  • ۱۹:۱۵

 Data mining(داده کاوی) و Data Warehousing هردو از تکنیک های بسیار قدرتمند و مشهور آنالیز داده محسوب می شوند. کاربرانی که به آمارها علاقه دارند از data mining استفاده می کنند. در data mining تلاش بر این است که با استفاده از مدل های آماری بتوان الگوهای مخفی در داده ها را پیدا کرد. کسانی که عمل data mining انجام می دهند به دنبال یافتن ارتباطات مفید بین عناصر داده ای متفاوت می باشند. یافتن این ارتباطات در دنیای امروزه و برای تجارت ها بسیار ارزشمند است. اما از طرف دیگر کارشناسان داده ای که ابعاد مختلف یک کسب و کار را به طور مستقیم بررسی می کنند علاقه دارند که از data warehousها استفاده نمایند

تعریف Data Mining

 Data mining همچنین با نام کشف دانش (KDD) نیز شناخته می شود. همانطور که گفتیم data mining یکی از فیلد های علوم کامپیوتر است که به استخراج اطلاعات مفید از داده های خام می پردازد. این اطلاعات مفید قبل از این که عمل data mining انجام شود ناشناخته باقی می ماند. با توجه به این که امروزه حجم داده ها به صورت تصاعدی رشد می کند، data mining می تواند یک ابزار بسیار مفید برای تبدیل این انبوه داده ها به اطلاعات هوش تجاری و سایر اطلاعات مفید باشد. این درحالی است که استخراج دستی دانش مفید و الگوهای مخفی بین داده ها در چند دهه اخیر تا حدودی غیر ممکن محسوب می شد. از این تکنیک امروزه برای آنالیز شبکه های اجتماعی، تشخیص کلاهبرداری و بازاریابی و بسیاری از جاهای دیگر مورد استفاده قرار می گیرد. معمولا data mining از چهار عمل تشکیل شده است

  • Clustering

  • Classification

  • Regression

  • Association

 Clustering به تشخیص داده های شبیه به هم و گروه بندی آنها گفته می شود. به این شکل که از داده هایی که ساختاری ندارند گروه هایی تشکیل می شوند که هر کدام از اعضای این گروه ها با سایر اعضای گروه ارتباط دارندClassification به عمل پیدا کردن قوانینی که می توان بر داده های جدید اعمال نمود، گفته می شود. classification شامل این مراحل است: پیش پردازش داده ها، طراحی مدل ها، ارزیابی و اعتبارسنجی ویژگی هاRegression به پیدا کردن توابعی با کمترین مقدار خطا را برای این که مدل داده ها را تولید کنیم می گویندAssociation جستجوی ارتباط بین متغیرها را گویند. Data mining اغلب به سوالاتی مانند این سوال پاسخ می دهد که در سال آینده کدام محصول فروش بیشتری در یک فروشگاه خواهد داشت؟ 

تعریف Data Warehousing

 

همانطور که گفته شد Data warehousing نیز برای آنالیز داده ها استفاده می شود ولی کاربران و اهداف متفاوتی دارد. برای مثال اگر بخواهیم فروشندگی را مثال بزنیم کاربران Data warehousing بر روی این نکته که کدام یک از خریدها بین کاربران مشهور تر است. بنابراین نتیجه این آنالیز به کاربر امکان را می دهد که با استفاده از تجربیات مشتریان بتوان تصمیم بهتری بگیرد. اما کسانی که عمل data mining انجام می دهند ابتدا یک فرضیه را ارائه می کنند که مثلا مشتریان یک جنس خاص را می خرند و داده ها را برای تست کردن فرضیه خود مورد استفاده قرار می دهند که آیا فرضیه شان درست بوده و یا خیر. بنابراین می توان نتیجه گرفت که این دو نوع آنالیز به نظر مشابه می آید ولی این گونه نیست. هردوی این آنالیز ها به افزایش سود با استفاده از تاریخچه داده ها می پردازند. اما تفاوت های کلیدی دارند. به زبان ساده data mining و data warehousing هرکدام نوع خاصی از آنالیز و بررسی را انجام می دهند. که کاربر هرکدام از این آنالیزها جدا می باشد. به عبارت دیگر data mining به دنبال وابستگی ها و الگوهایی آماری می گردد که بتواند با استفاده از آن یک فرضیه ارائه دهد و با استفاده از داده ها آن فرضیه را تست کند. اما data warehousing سوالات گسترده مقایسه ای را پاسخ می دهد و داده ها را تجزیه می کندتا بتواند راههای بهبود آنها را در آینده تشخیص دهد.


نویسنده: مهدی عادلی فر 
منبع: انجمن تخصصی فناوری اطلاعات ایران 

تفاوت Clear Text و Plain Text و Cipher Text در چیست ؟

  • ۱۹:۱۲

شاید برای خیلی از عزیزان واژه Clear Text و Plain Text یکسان به نظر برسد اما جالب است بدانید که در عین اینکه تقریبا همه جا این دو واژه به جای هم به کار می روند تعریف متفاوتی از آنها وجود دارد که به شکل زیر می باشند

1.      Cleartext : یک داده قابل خواندن است که بصورت واضح و روشن در یکجا ذخیره شده است و به بیان دیگر رمزنگاری نشده است

2.      Plaintext : در واقع ورودی یک الگوریتم رمزنگاری است ، هر داده ای به یک الگوریتم رمزنگاری وارد شود به عنوان Plaintext شناخته می شود

3.      Ciphertext : داده های غیرقابل خواندنی که از خروجی یک الگوریتم رمزنگاری خارج می شوند Ciphertext هستند.

4.      Plain Text : واژه با فاصله نوشته شده است دقت کنید ، به این معنی است که متن یا text هنوز قالب بندی نشده است ، یا برای مثال هنوز یک فایل متنی ساده است .

5.      Clear Text : واژه با فاصله نوشته شده است دقت کنید ، وقتی متنی به سادگی قابل درک و فهم باشد به آن Clear Text گفته می شود ، مثلا جمله من ITPRO را دوست دارم یک جمله واضح و شفاف و قابل فهم است.

اگر چیزی cleartext باشد احتمالا plain text هم می تواند باشد و به عنوان plaintext نیز می شود از آن استفاده کرد اما قطعا ciphertext نیست ، اگر چیزی plaintext است باید plain text نیز باشد ، امکان اینکه cleartext هم باشد وجود دارد و ممکن است در آینده تبدیل به ciphertext نیز بشود ، چیزی که ciphertext است حتما باید plain text باشد و به عنوان plaintext هم می تواند استفاده شود ولی قطعا cleartext نیست. الان قشنگ جا افتاد ؟ یعنی واقعا متوجه شدید ؟ من خودم متوجه نشدم چطور شما متوجه شدید !!! یه مثال می زنیم که قشنگ مفهوم جا بیوفته
فرض کنید قرار هست پسوردهای ویندوز در سیستم ذخیره بشن ، خوب طبیعتا password ای که در ذهن ما هست قرار هست از حالت قابل فهم یعنی Plaintext تبدیل به یک الگوریتم رمزنگاری یا Hash شده و در سیستم ذخیره شود یعنی تبدیل به Ciphertext می شود ، الان ورودی الگوریتم رمزنگاری Plaintext بوده است و خروجی ciphertext بوده است ، حالا اگر بخواهیم عکس این عملیات را انجام بدهیم یعنی ciphertext را تبدیل به یک Plaintext کنیم بی معنی است چون Plaintext ورودی الگوریتم است نه خروجی آن ، اگر خروجی داده شود نتیجه Plain Text یا متن قابل فهم خواهد بود ، جالب اینکه پسوردی که بصورت Hash وارد الگوریتم رمزنگاری می شود تا رمزگشایی شود هم چون ورودی الگوریتم ما است با اینکه ciphertext است اما plaintext نیز هست ... باور کنید بهتر از این نمیشه مثال زد

نویسنده : محمد نصیری 
منبعITPRO 

 

دانلود رایگان کتاب معرفی آزمون نرم افزار - نسخه انگلیسی

  • ۱۲:۲۷

Introduction-to-Software-Testing


این فایل نسخه انگلیسی است و حاوی 346 صفحه با حجم 2.13 مگابایت 


سلام
خوش آمدید
این وبلاگ رو به خاطر تبادل جزوه هایی که بدستم میرسه با هم دانشگاهیام راه اندازی کردم امیدوارم که بدردتون بخوره.

دانشگاه آزاد اسلامی - تهران شمال (کارشناسی)

Telegram : @From1989
دنبال کنندگان ۱ نفر
این وبلاگ را دنبال کنید
Designed By Sayid Yarmohammadi