Makine Öğrenmesi Teknikleriyle Akciğer Kanseri Tahminlemesi

Yazarlar

Deniz Herand
Sercan Düzel

Özet

Çalışmamızın amacı Amerika Birleşik Devletleri şehirlerinden alınan kanser verileri, soluduğumuz havada bulunan bileşik verileri ve bileşiklerin oranlarına göre oluşan kanser hastalarının sayısının artış ve azalışlarının incelenmesidir. Elde edeceğimiz sonuçlar; Akciğer kanserinin genetik faktörler gözetmeden sadece hava partikül büyüklüğü ve havada bulunan element ve bileşiklerin etkilerini görmeyi hedeflemektedir. Toplanan veriler makine öğrenmesi modellerinin,kümeleme yöntemleri ve regresyon modelleri ile incelenmesidir. Baz alınan ve toplanan veriler Türkiye Cumhuriyeti verilerini sağlayan Accuweather” ve Türkiye Cumhuriyeti Çevre Şehircilik ve İklim Değişikliği Bakanlığı” adresinden alınmış ,toplanan veriler ile  Türkiye Cumhuriyeti illeri üzerinde test yapılmış  ve algoritmik tahminleme modeli yapılması hedeflenmiştir. Modelin amacı gelecek yıllardaki kanser oranlarının tahminlenmesi yapılmasıdır. Araştırmamızda genetik faktörler ve hastalık öyküleri olmadığından dolayı sadece hava partikül verileri üzerinden araştırma ve tahminleme hedefi bulunmaktadır. Araştırmanın hedefi; Türkiye Cumhuriyeti üzerindeki riskli bölgeleri tespit edip, tespit edilen bölgelerdeki il sağlık kurumlarına  hava kirlilik durumlarını ve bu durumlarından dolayı oluşması muhtemel Akciğer kanseri oranlarınının gösterilmesi ve  önlem alınması gereken durumları belirtmek amacıyla yapılmıştır.

The aim of our study is to examine the increases and decreases in the number of cancer patients according to the cancer data obtained from the cities of the United States, the compound data in the air we breathe, and the ratios of the compounds.The results we will obtain;  It aims to see only the air particle size and the effects of the elements and compounds in the air, without considering the genetic factors of lung cancer. The collected data is analyzed in a machine learning model with clustering methods and regression models. The data based on the data collected from the Republic of Turkey were taken from “Accuweather” and the Republic of Turkey Ministry of Environment, Urbanization and Climate Change, and it was aimed to make an estimation model that was tested on the provinces of the Republic of Turkey.The aim of the model is to predict cancer rates in the coming years.Since there are no genetic factors and disease histories in our research, there is only the aim of research and estimation based on air particle data.The aim of the research;  It will be done in order to identify the risky areas on the Republic of Turkey, to show the air pollution conditions to the provincial health institutions in the detected regions, the rates of Lung cancer that these situations are likely to cause, and to indicate the situations that need to be taken precautions.

Referanslar

(Kaynak Yıl:2019 Yayın adı: Akciğer kanseri)(İnternetten erişim yılı 2022)(https://hsgm.saglik.gov.tr/tr/kanser-il-faaliyetleri.html?view=category&id=379&start=25

https://dergipark.org.tr/tr/download/article-file/270660 J CONTEMP MED 2016;6 (Case Reports): 131-137 REVIEW DOI: 10.16899/ctd. 80586

(Çevre, Şehircilik ve İklim Değişikliği Bakanlığı | Ulusal Hava Kalite İzleme Ağı )(İnternet erişim tarihi 2022) https://www.havaizleme.gov.tr/

MEVCUT HAVA KALİTESİ Mevcut Kirletici Maddeler (Erişim tarihi 2022) https://www.accuweather.com/

https://ci5.iarc.fr/CI5I-X/Pages/Table10q_sel.aspx (INDICES OF DATA QUALITY(volX))

https://www.researchgate.net/publication/321695891_Air_quality_and_lung_cancer_Analysis_via_Local_Control

Air quality and lung cancer: Analysis via Local Control December 2017 Conference: Joint Statistical Meetings(erişim yılı 2022) https://levelup.gitconnected.com/random-forest-regression-209c0f354c84

(Yılı 2017Makine öğrenmesi modelleri ve yöntemleri) (Erişi yılı 2022)https://veribilimcisi.com/2017/07/14/mse-rmse-mae-mape-metrikleri-nedir/

Adilov, G. , Tınaztepe, G. & Kemali, S. (2011). Genelleştirilmiş Ortalama Fonksiyonu ve Bazı Önemli Eşitsizliklerin Öğretimi Üzerine . Mersin Üniversitesi Eğitim Fakültesi Dergisi , 5 (2) , 294-300 . Retrieved fromhttps://dergipark.org.tr/tr/pub/mersinefd/issue/17374/181436

Korkem, Ebru. "Mikroarray Gen Ekspresyon Veri Setlerinde Random Forest Ve Naıve Bayes Sınıflama Yöntemleri Yaklaşım." (2013). MİKROARRAY GEN EKSPRESYON VERİ SETLERİNDE RANDOM FOREST VE NAIVE BAYES SINIFLAMA YÖNTEMLERİ YAKLAŞIMhttp://www.openaccess.hacettepe.edu.tr:8080/xmlui/bitstream/handle/11655/997/5b726bfb-45c9-41f6-a7a0-5c82c0ab86db.pdf?sequence=1

https://www.havaizleme.gov.tr/ (Çevre, Şehircilik ve İklim Değişikliği Bakanlığı | Ulusal Hava Kalite İzleme Ağı )(İnternet erişim tarihi 2022)

(WMO Sand and Dust Storm – Warning Advisory and Assessment System (SDS-WAS))

Referanslar

(Kaynak Yıl:2019 Yayın adı: Akciğer kanseri)(İnternetten erişim yılı 2022)(https://hsgm.saglik.gov.tr/tr/kanser-il-faaliyetleri.html?view=category&id=379&start=25

https://dergipark.org.tr/tr/download/article-file/270660 J CONTEMP MED 2016;6 (Case Reports): 131-137 REVIEW DOI: 10.16899/ctd. 80586

(Çevre, Şehircilik ve İklim Değişikliği Bakanlığı | Ulusal Hava Kalite İzleme Ağı )(İnternet erişim tarihi 2022) https://www.havaizleme.gov.tr/

MEVCUT HAVA KALİTESİ Mevcut Kirletici Maddeler (Erişim tarihi 2022) https://www.accuweather.com/

https://ci5.iarc.fr/CI5I-X/Pages/Table10q_sel.aspx (INDICES OF DATA QUALITY(volX))

https://www.researchgate.net/publication/321695891_Air_quality_and_lung_cancer_Analysis_via_Local_Control

Air quality and lung cancer: Analysis via Local Control December 2017 Conference: Joint Statistical Meetings(erişim yılı 2022) https://levelup.gitconnected.com/random-forest-regression-209c0f354c84

(Yılı 2017Makine öğrenmesi modelleri ve yöntemleri) (Erişi yılı 2022)https://veribilimcisi.com/2017/07/14/mse-rmse-mae-mape-metrikleri-nedir/

Adilov, G. , Tınaztepe, G. & Kemali, S. (2011). Genelleştirilmiş Ortalama Fonksiyonu ve Bazı Önemli Eşitsizliklerin Öğretimi Üzerine . Mersin Üniversitesi Eğitim Fakültesi Dergisi , 5 (2) , 294-300 . Retrieved fromhttps://dergipark.org.tr/tr/pub/mersinefd/issue/17374/181436

Korkem, Ebru. "Mikroarray Gen Ekspresyon Veri Setlerinde Random Forest Ve Naıve Bayes Sınıflama Yöntemleri Yaklaşım." (2013). MİKROARRAY GEN EKSPRESYON VERİ SETLERİNDE RANDOM FOREST VE NAIVE BAYES SINIFLAMA YÖNTEMLERİ YAKLAŞIMhttp://www.openaccess.hacettepe.edu.tr:8080/xmlui/bitstream/handle/11655/997/5b726bfb-45c9-41f6-a7a0-5c82c0ab86db.pdf?sequence=1

https://www.havaizleme.gov.tr/ (Çevre, Şehircilik ve İklim Değişikliği Bakanlığı | Ulusal Hava Kalite İzleme Ağı )(İnternet erişim tarihi 2022)

(WMO Sand and Dust Storm – Warning Advisory and Assessment System (SDS-WAS))

Yayınlanan

7 Kasım 2023

Lisans

Lisans