Take the First Step to Artificial Intelligence with the Best! | Certified Introduction to AI, Robotics and Data course is now Free

Join Global AI Hub Now!

x

Activity Forums Forum: Makine Öğrenmesi’ne Giriş DBSCAN for Supervised Learning

Forum: Makine Öğrenmesi’ne Giriş
  • DBSCAN for Supervised Learning

  • Muhammet Ali Kula

    Member
    September 2, 2021 at 11:11 pm

    Arkadaşlar merhaba,

    Ben öğrendiklerimi pekiştirmek için binary classification problemi üzerinde çalışmaya başladım. Basitçe kanser veya kanser değil diyecek bir model oluşturuyorum. Datasette multicollinearity yakalıdığım için preprocessing olarak PCA kullandım ve featureları 2’ye düşürdüm. Ardından xgboost ile Mert’in 4.modülde yaptığı gibi bir grafikle modelin ne yaptığına baktım ve İrem’in paylaştığı DBSCAN’e çok uyan bir şekil ortaya çıktı. Ancak DBSCAN’i bu datasete nasıl uygulayacağımı bulamadım. Ya da burada sadece KNN mi kullanmalıyım? Yardımcı olabilir misiniz? İsterseniz ilerlememi paylaşabilirim.

  • Banu Turkmen

    Member
    September 3, 2021 at 9:19 am

    Selam Muhammet,

    DBSCAN kullandigim bir kod parcasi asagida, 2 parametre girmen yeterli; eps ve min_samples. Ben en son gordugun gibi eps degeri olarak 0.0144 kullanmisim, ayrica bunu hesaplamanin da yontemleri var. Benimki clustering problemi idi, o yuzden her bir clusterda en az kac data olsun parametresini de 10 olarak girmisim benim ornekte toplam 5 cluster vardi.

    from sklearn.cluster import DBSCAN

    m=DBSCAN(eps=0.014473734767694877, min_samples=10)

    #When eps is chosen too small, most data will not be clustered at all (and labeled as -1 for “noise”).

    #When chosen too large, it causes close clusters to be merged into one cluster, and eventually the entire data set to be returned as a single cluste

    m.fit(X)

    dataset[‘dbscan_cluster’]=m.labels_ #boylece yeni feature yaratiyorsun ve cluster ya da class numarasini gorebiliyorsun, sende 0 ya da 1 olacaktir.

    Umarim isine yarar.

  • Muhammet Ali Kula

    Member
    September 3, 2021 at 2:25 pm

    Selam Banu,

    m.fit(X) dediğimiz yerdeki X ne oluyor?

    • Furkan Mehmet ÜN

      Member
      September 3, 2021 at 9:49 pm

      Selam Muhammet,

      Öncelikle buradaki doküman sayfasından inceleyebilirsin DBSCAN sınıfının fit metodunu.

      https://scikit-learn.org/stable/modules/generated/sklearn.cluster.DBSCAN.html#sklearn.cluster.DBSCAN.fit

      Sklearn’de .fit metodu, model.fit(X, y) şeklinde çağrılarak modeli parametre olarak geçilen verilere “uygun” hale getirecek işlemleri çalıştırıyor. Sadece supervised olarak da düşünülmemeli gerçi, örneğin scaling işlemi uygulayan StandardScaler sınıfının da bir fit metodu var.

      DBSCAN sınıfının fit metoduna verilen X değeriyse basitçe modele vermek ve üstünde kümeleme yapmak istediğin girdi matrisinin (n_samples, n_features) kendisi.

      • Muhammet Ali Kula

        Member
        September 3, 2021 at 10:17 pm

        Teşekkür ederim Furkan, supervised learning’te modeli eğitmek için bağımlı ve bağımsız değişken olarak bölüyorduk. Ancak unsupervised için buna gerek yoktu. Orada karıştırmışım.

Viewing 1 - 3 of 3 replies

Log in to reply.

Original Post
0 of 0 posts June 2018
Now