داده و الگو یکی از شاخص های بسیار مهم در دنیای اطلاعات هستند و خوشهبندی یکی از بهترین روشهایی است که برای کار با داده ها ارائه شده است. قابلیت آن در ورود به فضای داده و تشخیص ساختار آنها باعث گردیده که خوشه بندی یکی از ایدهآلترین مکانیزم ها برای کار با دنیای عظیم داده ها باشد.
در خوشهبندی، نمونهها به دستههایی تقسیم میشوند که از قبل معلوم نیستند. بنابراین، خوشهبندی یک روش یادگیری است که بدون دانش پیشین و مشاهده نمونههای از قبل تعریف شده، داده ها را به صورت خود مختار و مستقل دسته بندی می کند.
خوشه بندی در واقع یافتن ساختار در مجموعه داده هایی است که طبقه بندی نشده اند. به بیان دیگر خوشهبندی قراردادن داده ها در گروههایی است که اعضای هر گروه از زاویهی خاصی به هم شباهت دارند. در نتیجه شباهت بین داده های درون هر خوشه حداکثر و شباهت بین داده های درون خوشه های متفاوت حداقل میباشد. معیار شباهت در اینجا، فاصله بوده یعنی نمونههایی که به یکدیگر نزدیکترهستند، در یک خوشه قرار میگیرند. لذا محاسبهی فاصلهی بین دو داده در خوشهبندی بسیار مهم میباشد؛ زیرا کیفیت نتایج نهایی را دستخوش تغییر قرار خواهد داد.
فاصله که همان معرف عدم تجانس است حرکت در فضای داده ها را میسر میسازد و سبب ایجاد خوشه ها میگردد. با محاسبهی فاصلهی بین دو داده، میتوان فهمید که چقدر این دو داده به هم نزدیک هستند و در یک خوشه قرار می گیرند یا نه؟ توابع ریاضی مختلفی برای محاسبهی فاصله وجود دارند؛ فاصله اقلیدسی، فاصله همینگ و ….
1-1-بیان مسأله
خوشهبندی یافتن ساختار، درون مجموعه ای از داده های بدون برچسب است و میتوان آن را به عنوان مهمترین مسأله در یادگیری بدون نظارت در نظر گرفت. ایده خوشهبندی اولین بار در دهه 1935 مطرح شد و امروزه با پیشرفتها و جهشهای عظیمی که در آن بهوجود آمده در کاربردها و جنبه های مختلفی حضور یافته است. یک جستجوی ساده در وب یا حتی در پایگاه داده یک کتابخانه، کاربرد شگفت انگیز آن را برای ما آشکار میسازد. الگوریتمهای خوشهبندی در زمینه های مختلفی کاربرد دارد که به عنوان نمونه میتوان موارد زیر را برشمرد:
· داده کاوی[1]: کشف اطلاعات و ساختار جدید از دادههای موجود
· تشخیص گفتار[2]: در ساخت کتاب کد از بردارهای ویژگی، در تقسیم کردن گفتار بر حسب گویندگان آن یا فشردهسازی گفتار
· تقسیمبندی تصاویر[3]: تقسیمبندی تصاویر پزشکی یا ماهوارهای
· وب (WWW): دستهبندی اسناد و یا دستهبندی سایتها و …
· زیستشناسی[4]: دستهبندی حیوانات و گیاهان از روی ویژگیهای آنها
· برنامه ریزی شهری[5]: دستهبندی خانهها بر اساس نوع و موقعیت جغرافیایی آنها
· مطالعات زلزلهنگاری[6]: تشخیص مناطق حادثهخیز بر اساس مشاهدات قبلی
· کتابداری: دستهبندی کتابها
· بیمه: تشخیص افراد متقلب
· بازاریابی[7]: دستهبندی مشتریان به دسته هایی بر حسب نیاز آنها از طریق مجموعه آخرین خریدهای آنان.
با توجه به کاربرد روزافزون خوشهبندی، امروزه شاهد ارائه روشهای جدید و کارآمدتری هستیم که هر یک برای کاربردی خاص ارائه می شود. ولی با همه این تلاشها هنوز خوشهبندی در بسیاری از علوم آنچنان که باید مورد استفاده قرار نگرفته است و قابلیت گسترش بسیار زیادی برای آن وجود دارد.
(در فایل دانلودی نام نویسنده موجود است)
تکه هایی از متن پایان نامه به عنوان نمونه :
(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)
فهرست مطالب
فصل اول: معرفی پژوهش……………………………………………………………………………………………………………….1
الف: بیان مساله……………………………………………………………………………………………………………………………..2
ب: اهداف…………………………………………………………………………………………………………………………………….4
ج: سوالات……………………………………………………………………………………………………………………………………5
محدودیت های پژوهش…………………………………………………………………………………………………………………6
واژه ها و اصطلاحات…………………………………………………………………………………………………………………….6
فصل دوم: دانستنی های موجود در پژوهش………………………………………………………………………………………7
چهار چوب پنداشتی………………………………………………………………………………………………………………………8
مطالعات……………………………………………………………………………………………………………………………………..15
فصل سوم: مواد و روش کار…………………………………………………………………………………………………………18
نوع مطالعه………………………………………………………………………………………………………………………………….19
جامعه پژوهش…………………………………………………………………………………………………………………………….19
روش نمونه گیری………………………………………………………………………………………………………………………..19
روش محاسبه و حجم نمونه………………………………………………………………………………………………………….19
چگونگی جمع آوری اطلاعات……………………………………………………………………………………………………..20
روش تجزیه و تحلیل اطلاعات……………………………………………………………………………………………………..20
ملاحظات اخلاقی ……………………………………………………………………………………………………………………….20
مشکلات اجرایی…………………………………………………………………………………………………………………………21
جدول متغیر ها……………………………………………………………………………………………………………………………22
فصل چهارم: نتایج……………………………………………………………………………………………………………………….23
سن……………………………………………………………………………………………………………………………………………24
جنس…………………………………………………………………………………………………………………………………………26
نوع تومر…………………………………………………………………………………………………………………………………….27
محل تومر…………………………………………………………………………………………………………………………………..29
علائم بالینی………………………………………………………………………………………………………………………………..31
ابتلا به عفونت هلیکو باکتر……………………………………………………………………………………………………………33
سابقه فامیلی………………………………………………………………………………………………………………………………..34
گروه خونی…………………………………………………………………………………………………………………………………35
مصرف سیگار……………………………………………………………………………………………………………………………..37
محل اقامت ………………………………………………………………………………………………………………………………..38
فصل پنجم: بحث…………………………………………………………………………………………………………………………39
بحث………………………………………………………………………………………………………………………………………….40
فصل ششم:نتیجه گیری وپیشنهادات ……………………………………………………………………………………………..42
نتیجه گیری…………………………………………………………………………………………………………………………………43
پیشنهادات…………………………………………………………………………………………………………………………………..44
فهرست منابع………………………………………………………………………………………………………………………………45
پیوست……………………………………………………………………………………………………………………………………….47
فهرست جداول
جدول1-4 توزیع فراوانی سن بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389………………………24
جدول2-4 فراوانی جنسی بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389…………………………..26
جدول3-4 فراوانی انواع تومرهای بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389………………27
جدول4-4 فراوانی محل های گرفتاری تومر بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389…..29
جدول 5-4 فراوانی علائم بالینی بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389…………………..31
جدول 6-4 فراوانی ابتلا به عفونت هلیکوباکتر پیلوری در بیماران مبتلا به سرطان معده در استان قم از
سال 1384-1389………………………………………………………………………………………………………………………..33
جدول 7-4 فراوانی وجود سابقه فامیلی در بستگان درجه اول بیماران مبتلا به سرطان معده در استان قم
از سال 1384-1389…………………………………………………………………………………………………………………….34
جدول8-4 فراوانی گروه های خونی بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389…………….35
جدول 9-4 فراوانی مصرف سیگار بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389………………37
جدول 10-4 فراوانی محل اقامت بیماران بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389……….38
فهرست نمودارها
نمودار شماره 1-4: توزیع فراوانی سن بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389………….25
نمودار شماره3-4: فراوانی انواع تومرهای بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389…….28
نمودار شماره4-4: فراوانی محل های گرفتاری تومر بیماران مبتلا به سرطان معده در استان قم از سال 1384-
1389………………………………………………………………………………………………………………………………………..30
نمودار شماره5-4: فراوانی علائم بالینی بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389…………32
نمودار 8-4: فراوانی گروه های خونی بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389………….36
فصل اول: معرفی پژوهش
1-1-بیان مسئله
یکی از سرطان های شایع دستگاه گوارش سرطان معده است که به علت تهاجمی بودن و نداشتن علائم بالینی مشخص بیماران در مواقع مراجعه در مرحله پیشرفته بیماری بوده و از طول عمر کوتاهی برخوردار هستند .
85 درصد موارد کنسر معده آدنو کارسینوم است که خود به دو نوع منتشر و روده ای تقسیم میشود.نوع منتشر در جوانان بیشتر مشاهده شده ، کل معده را درگیر می کند و پیش اگهی بدی دارد. نوع روده ای درآنتروم و انحنای کوچک معده است و فرایند پیش سرطانی دراز مدت دارد و بیشتر تمایل دارد در مناطق جغرافیایی پر خطر ایجاد شود و احتمال بروز آن در مناطقی که سرطان معده کاهش یافته کم است.
15 درصد سرطان های معده را لنفوم ها و تومر های استرومایی دستگاه گوارش و لیومیو سارکوم تشکیل می دهند.
در ایالات متحده قسمت دیستال معده محل ایجاد 30 درصد سرطان های معده است،حدود 20درصد در قسمت میانی وحدود 37 درصد در یک سوم پروگزیمال معده ایجاد می شود.13 درصد باقی مانده کل معده را درگیر میکنند.
سرطان معده در مراحل سطحی و قابل در مان بودن معمولا علامتی ندارد.با گسترش تومر علائمی به صورت درد قسمت فوقانی شکم،بی اشتهایی،تهوع خفیف وکاهش وزن ایجاد می شود.
ریسک فاکتور های کنسر معده عبارتند از مصرف طولانی مدت غلظت های بالای نیترات ها در غذاهای خشک شده دودی ونمک سود شده،هلیکو باکتر پیلوری که البته در فرم منتشر و پروگزیمال نقش ندارد،فقدان اسیدیته در موارد آکلریدی،گاستریت آتروفیک و حتی آنمی پرنشیوز در سالمندان ،اعمال جراحی آنتر معده ،گروه خونیA وزخم معده .(1)
به دلایل نامعلوم میزان بروز و مرگ و میر ناشی از سرطان معده در75 سال گذشته به طور قابل توجهی کاهش یافته است،با این وجود هنوز سرطان معده چهارمین سرطان شایع و دومین سرطانی است که منجر به مرگ می شود.
بیشترین شیوع سرطان معده در کشورهای ژاپن،چین،شیلی و ایرلند است.(1)
میزان مرگ ومیر ناشی از سرطان معده در ایالات متحده در مردان از 28نفر به 8/5نفر در هر 100000نفر رسیده در حالی که زنان این میزان از 27نفر به 8/2 نفرکاهش یافته است.با این حال 21260مورد جدید سرطان معده در ایالات متحده تشخیص داده شده اند و11210 آمریکایی در سال 2007 در اثر بیماری جان باخته اند(3)که این امار نشان دهنده لزوم بررسی بیشتر در مورد ریسک فاکتور ها و علل این سرطان می باشد.
شیوع انواع مختلف سرطان معده بر اساس موقعیت ژئوگرافی،نژاد وشرایط سوشیو اکونومیک متفاوت است.
در ایران شیوع سرطان معده در مناطق شمال و شمال غربی کشور بیشتر است . مناطق شمال و شمال غربی ایران مناطق پر خطر برای سرطان معده میباشند.اردبیل بیشترین شیوع را داراست و در مرتبه بعدی استان های مازندران ، گلستان ،شرق آذربایجان ونواحی وابسته به تهران ریت بالایی از سرطان معده را دارا هستند .در کرمان که یک استان جنوبی است شیوع کمتری از سرطان معده گزارشی است .در اردبیل شیوع سرطان کاردیا بیشتر از غیر کاردیایی بیان شده است .در ریسک فاکتور های بررسی شده هلیکوباکتر پیلوری،آتروفیک گاسترایتیس و مصرف زیاد salt مهمترین ریسک فاکتور هادر ایران یافت شده دارد.مصرف کم میوه تازه و مصرف زیاد گوشت قرمز نیز در ایران به عنواو عامل خطر در ایران می باشند(2).
با بررسی اپیدمیو لوژی سرطان معده در استان قم وشناسایی ریسک فاکتور های موجود میتوان بر روی ریسک فاکتور های محیطی مداخله کرد و به عنوان یک مودالیته اصلی کاهش دهنده پیشرفت سرطان معده،برنامه های پایشی یافتن کنسر معده در مراحل اولیه در گروه های های ریسک راآغاز کرده وریت بقا را در بیماران دارای پتانسیل بدخیمی در گروه های های ریسک افزایش داد.
با توجه به مطالعات انجام شده در سایر استان های ایران ونیز سراسر جهان،تفاوت های موجود از نظر ریسک سرطان معده در موقعیت های ژئوگرافی مختلف و نیز اختلاف بارز تعداد ریسک فاکتورهای محیطی که در هر ناحیه وجود دارد فرصت مناسبی را برای بررسی در مورد اتیولوژی سرطان معده فراهم کرده است.
2-1-اهداف
1-2-3– اهدف اصلی:
تعیین ویژگی های اپیدمیولوژیک سرطان معده در استان قم از سال 1384-1389
4-2-1– اهداف فرعی:
1-تعیین توزیع فراوانی سن بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389
2-تعیین فراوانی جنسی بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389
3-تعیین فراوانی مصرف سیگار بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389
4-تعیین فراوانی گروه های خونی بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389
5-تعیین فراوانی ابتلا به عفونت هلیکوباکتر پیلوری در بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389
6-تعیین فراوانی انواع تومرهای بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389
7-تعیین فراوانی محل های گرفتاری تومر بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389
8-تعیین فراوانی علائم بالینی بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389
9-تعیین فراوانی وجود سابقه فامیلی در بستگان درجه اول بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389
10-تعیین فراوانی محل اقامت بیماران مبتلا به سرطان معده در استان قم از سال 1384-1389
مساله زنجیره تامین در دنیای امروز به عنوان یک مزیت رقابتی عمده در راستای کاهش قیمت تمام شده مطرح است. زنجیره تامین شامل خرید و تامین، لجستیک و حمل و نقل، بازاریابی، رفتار سازمانی، شبکه، مدیریت استراتژیک، مدیریت سیستم های اطلاعاتی و مدیریت عملیات می باشد. یک زنجیره تامین سیستمی متشکل از پنج سطح تأمین کننده، تولید کننده، توزیع کننده، خرده فروش و مشتری نهایی است که به هم مرتبط اند. اعضای زنجیره تامین عمومأ از طریق جریان اطلاعات و جریان فیزیکی کالا با یکدیگر در ارتباط می باشند. با وجود این مطلب، تصمیم گیری در مراحل مختلف این روند و هماهنگی این مراحل، مساله اصلی در زنجیره تامین می باشد با توجه به رقابت شدیدی که بین تولید کنندگان وجود دارد، در صورتی که هر کدام از حلقه های این زنجیره ضعیف عمل کند، کل مجموعه موفق نخواهد
بود و در سطح مورد انتظار عمل نخواهد کرد. بنابراین مدیریت موثر این زنجیره در صنعت یک چالش مدیریتی عمده به حساب می آید.
در سالهای اخیر، شرکت ها و سازمان های کشورهای صنعتی و پیشرفته جهان، توجه ویژه ای به مدیریت زنجیره تامین داشته اند و از این رهگذر به موفقیت های قابل توجهی نیز دست یافته اند که گواه این امر، حجم بالایی از مبادلات تجاری انجام شده و درآمد و سود آوری بالای زنجیره تامین موفق و کارآمد است که در بازارهای به شدت رقابتی امروز، موفق به پیشی گرفتن از رقبا شده اند.
فناوری های موجود با شتاب به سوی تخصصی شدن و جهانی شدن پیش میرود. برای دوام در عرصه رقابت جهانی، تولیدکنندگان باید پاسخگوی تقاضای مصرف کنندگان در شرایط مختلف باشند. در فضای رقابتی کنونی، نقش تأثیرگذار مراکز توزیع در تحویل به موقع کالا به مشتری وکاهش هزینه های نگهداری موجودی توجه بسیاری از مدیران زنجیره تأمین را به خود جلب نموده است. این مسأله بسیاری از تولید کنندگان را وادار به پیاده سازی تولید ناب و زنجیره تأمین ناب نموده است. از آنجایی که انبار عبوری جزء اصلی برای طراحی یک زنجیره تامین ناب می باشد ، کمپانی های لجستیکی با حجم نقل و انتقالات بالا به استفاده از انبار عبوری روی آورده اند.
سیستم انبار عبوری دارای مزایایی مانند چابکی زنجیره تأمین، گردش بالای موجودی، هزینه پایین نگهداری موجودی، و هزینه پایین حمل و نقل و فضای کم مورد نیاز در مقایسه با انبارداری سنتی می باشد. نقطه قوت انبار عبوری سیاست تجمیع محصولات در انبار بوده که سبب می گردد محصولات مورد نیاز مشتریان از تامین کنندگان مختلف به جای ارسال مستقیم، در انبار عبوری جمع آوری شوند و پس از طبقه بندی بر اساس تقاضای مشتری به مقصد مورد نظر ارسال شوند که این گردآوری هزینه های حمل ونقل را کاهش می دهد.
1-2- بیان مسئله
در این تحقیق، مدل غیرخطی چند دوره ای مکانیابی-مسیریابی در حالت چند کالایی[1] و وسایل نقلیه متفاوت[2] با قابلیت حمل کالاهای متفاوت ارائه شده.و همچنین برداشت و تحویل در چند بار[3] مجاز می باشد ارائه میشود. که هدف تعیین حداقل تعداد انبار عبوری از بین مجموعه مکانهای گسسته موجود و حداقل نمودن مجموع هزینه باز شدن مراکز انبار عبوری و هزینه حمل (هزینه توزیع ، هزینه عملیاتی) وسایل نقلیه می باشد. بطور کلی هدف مدل بدست آوردن تعداد مراکز انبار عبوری، تعداد وسیله نقلیه و بهترین مسیر در شبکه توزیع می باشد. و یک مدل برنامه ریزی غیرخطی عدد صحیح برای این مساله ارائه می دهیم.
نیاز بشر به پردازش و ذخیره سازی اطلاعات در دهه های گذشته همواره رشد صعودی و شتابدار داشته است. به گونه ای که حرکت از سیستم های توزیع شده بر روی سوپرکامپیوترهای گران قیمت به شبکه های بسیار پر قدرت و ارزان در مدت نسبتا کوتاهی صورت گرفته است. همچنین نیاز به مدیریت اطلاعات، پردازش، گردش کار و دیگر ابزار مدیریتی همواره رشد فزاینده داشته است. به طبع این نیاز، ساختار سیستم های کامپیوتری در سطوح فنی و مدیریتی نیز رشد کرده و پیچیده تر شده است.
به منظور جوابگویی به این حجم فزاینده درخواست ها و نیاز بازار به منابع پردازش و ذخیره سازی اطلاعات و نیز به منظور ارائه سرویس های مورد نیاز با کیفیت مناسب و قابل رقابت، یکی از بهترین راه های پیشنهاد شده، متمرکز نمودن این منابع و مدیریت صحیح آنها است. به این منظور و برای به حداکثر رساندن کیفیت خدمات و حداقل نمودن هزینه ها یکی از رایج ترین راهکارهای موجود راه اندازی مراکز داده یا دیتا سنتر ها می باشد. در این طرح با آماده سازی زیر ساخت های فیزیکی، امنیتی، شبکه ای، سخت افزاری و نرم افزاری، مجموعه ای از سرورهای قدرتمند برای ارائه سرویس های مورد نیاز مشتریان در نظر گرفته می شود. این سرورها با خطوط بسیار پر سرعت بر حسب نیاز به اینترنت یا شبکه های سازمانی متصل می گردند و با نصب سیستم های عامل و نرم افزارها و سرویس های مورد نیاز به کاربران خدمات لازم را ارائه می نمایند. با وجود چنین مراکزی دیگر سازمان ها و مراکز تجاری، صنعتی، دانشگاهی و غیره نیازی به راه اندازی مراکز سرویس دهی محلی[1] و نیز متحمل شدن هزینه های نگهداری، به روز رسانی و استخدام متخصصین نخواهند داشت. در ادامه به بررسی اجمالی دیتا سنترها خواهیم پرداخت تا بتوانیم طرح پیشنهادی را تشریح نمائیم.
تعریف دیتا سنتر: مجموعه ای از سیستمهای پشتیبانی (از جمله زیر ساخت سخت افزاری passive، زیرساخت خنک کننده، زیر ساخت تامین انرژی، اطفاء حریق و غیره)، منابع پردازشی سخت افزاری شامل سرورها، تجهیزات زیرساخت شبکه، زیرساخت ذخیره سازی داده ها و زیرساخت نرم افزاری شامل ابزار یک پارچه سازی[2]، مجموعه ای از سیستم های عامل، مجموعه ای از نرم افزارهای کاربردی شامل سرویس ها، تعدادی پایگاه داده، مجموعه ای از ابزارهای امنیتی نرم افزاری و سخت افزاری و یک ساختار مدیریتی است. این سیستم به کمک خطوط پرسرعت به شبکه های خارجی (Intranet، Extranet یا اینترنت) متصل است ]1[.
با توجه به رشد نیازها و احتیاج کاربران به انعطاف پذیری و تحمل خطای بالا در این مراکز پردازشی، در سال های اخیر تکنولوژی مجازی سازی[3] به عنوان پاسخی به این نیازها و بهترین شیوه یکپارچه سازی ارائه شده و بسیار رشد کرده است. در حقیقت، این تکنولوژی به عنوان لایه مدیریت نرم افزاری و سیستم عاملی دیتا سنتر مورد استفاده قرار می گیرد. در ادامه به تشریح تکنولوژی مجازی سازی و نحوه استفاده از آن در این طرح خواهیم پرداخت.
تکنولوژی مجازی سازی یکی از جوانترین نظریه های مطرح شده در علم کامپیوتر می باشد که در ده سال اخیر توجه زیادی را به خود جلب نموده است. این تکنولوژی از این بابت بسیار جذاب است که انعطاف پذیری و امکانات خارق العاده ای را بر روی همان بستر سخت افزاری موجود ارائه می دهد و استفاده از آن هزینه بسیار ناچیزی برای سازمان دارد.
معماری مجازی سازی، همه منابع پردازشی از جمله سرورها، منابع ذخیره سازی[4] و شبکه را به یک ساختار مجازی نگاشت می دهد. این زیر ساخت با گردآوری همه منابع و نمایش مجموعه ای ساده شده و یکپارچه از آنها، مدیر را در درک بهتر ساختار فنی دیتا سنتر و مدیریت و تغییر آن یاری می رساند. به کمک این ساختار می توان منابع توزیع شده در یک دیتا سنتر را به صورت مجموعه ای یکپارچه از ابزار مدیریت نمود. همچنین می توان از دیتا سنتر برای مصارف گوناگونی استفاده کرد بدون اینکه نگران گوناگونی سخت افزارها و نحوه اتصال آن ها به سیستم باشیم؛ ]2[ و ]3[.
از این تکنولوژی برای طراحی زیر ساخت نرم افزاری دیتا سنتر استفاده خواهد شد. با این توضیح که به جای نصب یک سیستم عامل بر روی هر دستگاه سرور، از یک نرم افزار مجازی سازی به نام Hypervisor استفاده می شود. این نرم افزار شبه سیستم عامل به مدیر سیستم اجازه می دهد که به تعداد دلخواه کامپیوتر مجازی[5] بر روی سرور مذکور راه اندازی کرده و سیستم عامل و سرویس های دلخواه را بر روی آن نصب نماید (شکل 1.1).
شکل 1.1. نحوه قرارگیری لایه های نرم افزاری بر روی سرور
با این ترکیب می توان امکانات بسیار زیادی از جمله قابلیت دسترسی دائمی به سرویس ها (HA)[6] و مقاوم سازی سرویس ها در مقابل خطا[7] که از ضروریات چنین دیتا سنتری می باشد را با کمترین هزینه میسر نمود. همچنین امکان انتقال این کامپیوترهای مجازی در حال کار از روی یک سرور به سرور دیگر را بدون تاخیر زمانی وجود دارد[8].
در دیتاسنتری با این ابعاد، اغلب سرویس های در حال کار بسیار حیاتی و حساس بوده و از کار افتادن آن ها هزینه های هنگفت و بعضا جبران ناپذیری برای سازمان مربوطه به دنبال خواهد داشت. به همین دلیل لازم است امکانات حرفه ای را در دیتا سنتر به منظور محافظت از سرویس ها پیاده سازی نمائیم تا در دسترس بودن و سلامت آنها را تضمین کند. شکل 1.2 شمایی کلی از یک دیتا سنتر را با بهره گرفتن از معماری یاد شده نشان می دهد.
شکل 1.2. شمای کلی دیتا سنتر با معماری مجازی
با توجه به نیاز به این مراکز و پیچیدگی ذاتی آنها، ترسیم یک مدل فرمال از ماهیت یک دیتا سنتر، چه پیش از طراحی[9] و چه پس از آن[10]، می تواند در شناخت طرز کار و چگونگی فعالیت چنین مرکزی نقش به سزایی داشته باشد. از جمله این کاربردها می توان به تشخیص بن بست ها[11] و گلوگاه ها[12] قبل از طراحی و محک زدن[13] سیستم بعد از طراحی اشاره نمود. با در دست داشتن این مدل (تصویر فرمال) جریان کنترل در سیستم قابل رویت بوده و در نتیجه رفتار سیستم را می توان بررسی و پیش بینی نمود ]4[. البته باید توجه داشت که در سیستم های واقعی از جمله دیتا سنترها، به دست آوردن مدل جامع تقریبا غیر ممکن بوده و تنها می توان بخش هایی از سیستم را با نادیده گرفتن برخی از پارامترها مدل نمود. هرچقدر مدل به سیستم واقعی نزدیکتر باشد بررسی رفتار سیستم به کمک مدل حاصل دقیقتر و کاربردی تر خواهد بود. در بخش های بعدی با بررسی دقیقتر ماهیت مدل سازی فرمال، با انواع شیوه ها در این حوزه[14] بیشتر آشنا خواهیم شد.
به طور کلی متد های فرمال نوع خاصی از شیوه های بیان فرمال مسائل هستند که از آنها برای تشریح و تبیین[15] سیستم های کامپیوتری و همچنین اثبات رفتار آنها[16] در سطح سخت افزار و نرم افزار استفاده می شود. هدف از توضیح رفتار یک سیستم به کمک روش های فرمال، بررسی رفتار و خصوصیات سیستم از جمله میزان حد پذیری[17]، بازگشت پذیری[18] و نیز پارامترهای انتزاعی تر مانند میزان ثبات[19] و پایداری[20] می باشد ]5[.
بدیهی است انجام چنین کاری در مورد سیستم های واقعی با توجه به پارامترهای متعدد و ساختار پیچیده آنها بسیار وقت گیر و دشوار است و در بسیاری از مواقع فقط بخش هایی از سیستم را می توان در حد قابل قبولی تشریح و مدل نمود. به همین دلیل و نیز به دلیل هزینه بسیار گزاف این فرایند، استفاده از شیوه های فرمال برای توضیح رفتار سیستم فقط در مورد سیستم های بسیار حساس و گران قیمت صورت می گیرد.
در این تحقیق، از زبان شبکه های پتری که ابزاری گرافیکی برای تشریح رفتار سیستم ها می باشد بهره گرفته شده است. این زبان در واقع نوع خاصی از ماشین های متناهی (اتوماتا) می باشد که امکان ترسیم جریان کنترل در سیستم را به صورت ساختار گراف و تعریف مجموعه ها فراهم می کند.
[1] Local Farm Servers
[2] Consolidation
[3] Virtualization technilogy
[4] Storage
[5] Virtual Machine
[6] High Availability
[7] Fault Tolerance
[8] VMotion
[9] Pre-analysis modeling
[10] Post-analysis modeling
[11] Deadlock
[12] Bottleneck
[13] Benchmarking
[14] Formal Modeling
[15] Specification
[16] Verification
[17] Boundedness
[18] Reversibility
[19] Robustness
[20] Stability
شرکتهای تجاری و بازرگانی برای ادامه بقا و حفظ بازار همواره بر سود دهی و کاهش ضرر و زیان خود تاکید دارند از این رو روش های جذب مشتری و همچنین تکنیکهای جلوگیری یا کاهش زیان در سرلوحه کاری این شرکتها قرار می گیرد.
از جمله شرکتهایی که بدلایل مختلف در معرض کاهش سود و یا افزایش زیان قرار می گیرند شرکتهای بیمه ای می باشند. عواملی همچون بازاریابی، وفاداری مشتریان، نرخ حق بیمه، تبلیغات، تقلب، می تواند باعث جذب یا دفع مشتری گردد که در سود و زیان تاثیر مستقیم و غیر مستقیم دارد.
پرداخت خسارت نیز به عنوان تعهد شرکتهای بیمه منجر به کاهش سود و در بعضی موارد موجب زیان یک شرکت بیمه می شود. خسارت می تواند بدلایل مختلف رخ دهد و یا عملی دیگر به گونه ای خسارت جلوه داده شود که در واقع اینچنین نیست.
عواملی از قبیل فرهنگ رانندگی، داشتن گواهینامه رانندگی، نوع گواهینامه و تطابق یا عدم تطابق آن با وسیله نقلیه، جاده های بین شهری و خیابانهای داخل شهر که شهرداری ها و ادارات راه را به چالش می کشد، تقلب، وضعیت آب و هوا، کیفیت خودروی خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بیمه با مورد بیمه ، روزهای تعطیل، مسافرتها و بسیاری موارد دیگر می توانند موجب خسارت و در نهایت افزایش زیان یک شرکت بیمه ای گردند.
بیمه صنعتی سودمند، ضروری و مؤثر در توسعه اقتصادی است. این صنعت بدلیل «افزایش امنیت در عرصه های مختلف زندگی و فعالیتهای اقتصادی»، «افزایش سرمایه گذاری و اشتغال و رشد اقتصادی» و « ارتقای عدالت اقتصادی و کاهش فقر ناشی از مخاطرات »، حائز جایگاه مهمی در پیشرفت و تعالی یک کشور است.
با وجود نقش مهم بیمه در بسترسازی و تأمین شرایط مساعد اقتصادی، وضعیت کنونی این صنعت در اقتصاد ملی با وضعیت مطلوب آن
فاصله زیادی دارد. عدم آشنایی عمومی و کم بودن تقاضا برای محصولات بیمه ای، دانش فنی پایین در عرصه خدمات بیمه ای، عدم تطابق ریسک با حق بیمه، تفاوت فاحش در مقایسه معیارهای تشخیص ریسک بیمه شخص ثالث با نوع بیمه معادل در کشورهای توسعه یافته، وجود نارسایی ها در مدیریت واحدهای عرضه بیمه از دلایل عدم توسعه مناسب این صنعت در کشور است. از آنجا که بشر در طول تاریخ به کمک علم و تجربه رستگاری ها و توفیقات فراوانی کسب کرده است، نگاه علمی تر به مشکلات این صنعت و یافتن راه حل در بستر علم می تواند راه گشا باشد.
امروزه بوسیله روش های داده کاوی ارتباط بین فاکتورهای مختلف موثر یا غیر موثر در یک موضوع مشخص می شود و با توجه به اینکه داده کاوی ابزاری مفید در استخراج دانش از داده های انبوه می باشد که ارتباطات نهفته بین آنها را نشان می دهد، شرکتهای تجاری بازرگانی رو به این تکنیکها آورده اند.
داده کاوی محدود به استفاده از فناوری ها نیست و از هرآنچه که برایش مفید واقع شود استفاده خواهد کرد. با این وجود آمار و کامپیوتر پر استفاده ترین علوم و فناوری های مورد استفاده داده کاوی است.
داده کاوی روند کشف قوانین و دانش ناشناخته و مفید از انبوه داده ها و پایگاه داده است[ Liu et. al 2012].
انجام عمل داده کاوی نیز مانند هر عمل دیگری مراحل خاص خود را دارد که به شرح زیر می باشند:
1-جدا سازی داده مفید از داده بیگانه
2-یکپارچه سازی داده های مختلف تحت یک قالب واحد
3-انتخاب داده لازم از میان دیگر داده ها
4- انتقال داده به محیط داده کاوی جهت اکتشاف قوانین
5-ایجاد مدلها و الگوهای مرتبط بوسیله روش های داده کاوی
6-ارزیابی مدل و الگوهای ایجاد شده جهت تشخیص مفید بودن آنها
7-انتشار دانش استخراج شده به کاربران نهایی