Borsa İstanbul’da Fiyat Anomalilerinin Tespiti: İzolasyon Ormanı Algoritması İle Ampirik Bir Çalışma
Özet
Bu çalışma, Borsa İstanbul (BIST) 30 Endeksi’nde yer alan hisse senetlerinin 13 Mart 2020 ile 31 Ekim 2025 tarihleri arasındaki günlük getirilerinde görülen fiyat anomalilerini incelemektedir. Çalışmada, geleneksel istatistiksel yöntemlerin aksine, verideki karmaşık desenleri öğrenebilen ve aykırı değerleri "az ve farklı" olma özelliklerine göre izole eden İzolasyon Ormanı adlı gözetimsiz makine öğrenmesi algoritması kullanılmıştır. Toplam 39.424 gözlem noktası üzerinden yapılan analizde 770 adet fiyat anomalisine rastlanmıştır. Araştırma bulguları, anomalilerin özellikle makroekonomik ve sistemik şok dönemlerinde (TCMB başkan değişikliği ve deprem sonrası alınan düzenleyici tedbirler gibi) yoğunlaştığını ve bu dönemlerde hisse senetlerinin çoğunda eş zamanlı sapmalar yaşandığını ortaya koymaktadır. Bu sonuç, finansal piyasalarda dışsal şokların fiyat oluşum mekanizmasını kısa vadede ciddi biçimde bozabildiğini kanıtlamaktadır. İstatistiksel olarak anomali dönemlerinin mutlak getirileri, normal dönemlerden anlamlı düzeyde farklı bulunmuştur. Sonuç olarak çalışma, BIST 30'da fiyat oluşum süreçlerinin her zaman rasyonel olmadığını ve piyasanın zayıf formda dahi etkin olmadığını göstererek, bu tür algoritmaların risk yönetiminde güçlü bir erken uyarı aracı olarak kullanılabileceğini kanıtlamaktadır.
This study investigates price anomalies in the daily returns of BIST 30 Index stocks from March 13, 2020, to October 31, 2025. Unlike traditional statistical methods, the research employs the Isolation Forest algorithm, an unsupervised machine learning technique that identifies outliers based on the premise that anomalies are "few and different". The analysis, covering 39,424 observation points, successfully detected 770 price anomalies. Findings reveal that anomalies are predominantly clustered during periods of macroeconomic and systemic shocks, such as the change in the CBRT governorship and regulatory measures following the Kahramanmaraş earthquakes, leading to simultaneous deviations across most stocks. This result confirms that external shocks in financial markets can severely impair the price formation process in the short term.Then, absolute returns during anomaly periods were found to be significantly different from normal periods. Ultimately, the study confirms that price formation processes in BIST 30 are not always rational and that the market is not efficient even in its weak form, suggesting that such algorithms can serve as robust early warning tools in risk management.
Referanslar
Akoglu, L., Tong, H., & Koutra, D. (2015). Graph-based anomaly detection and description: A survey. Data Mining and Knowledge Discovery, 29(3), 626–688. https://doi.org/10.1007/s10618-014-0365-y.
Ahmed, M., Mahmood, A. N., & Hu, J. (2016). A survey of network anomaly detection techniques. Journal of Network and Computer Applications, 60, 19–31. https://doi.org/10.1016/j.jnca.2015.11.016.
Bakumenko, A., & Elragal, A. (2022). Detecting Anomalies in Financial Data Using Machine Learning Algorithms. Systems, 10(5), 130. https://doi.org/10.3390/systems10050130.
Breunig, M. M., Kriegel, H. P., Ng, R. T., & Sander, J. (2000). LOF: identifying density-based local outliers. In Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data, pp. 93-104. https://doi.org/10.1145/335191.335388
Chandola, V., Banerjee, A., & Kumar, V. (2009). Anomaly detection: A survey. ACM Computing Surveys, 41(3), 1–58. https://doi.org/10.1145/1541880.1541882.
Ester, M., Kriegel, H. P., Sander, J., & Xu, X. (1996). A density-based algorithm for discovering clusters in large spatial databases with noise. In KDD-96 Proceedings, 96(34), pp. 226-231.
Hawkins, D. M. (1980). Identification of outliers. Springer.
Ji, J. (2024). A Machine Learning Approach to Detecting Financial Anomalies in Large Global Companies. 2024 4th International Conference on Big Data, Artificial Intelligence and Risk Management (ICBAR 2024), 1–6. https://doi.org/10.1145/3718751.3718820.
Liu, F. T., Ting, K. M., & Zhou, Z.-H. (2008). Isolation forest. 2008 Eighth IEEE International Conference on Data Mining, 413–422. https://doi.org/10.1109/ICDM.2008.17.
MacQueen, J. (1967). Some methods for classification and analysis of multivariate observations. In Proceedings of the 5th Berkeley Symposium on Mathematical Statistics and Probability, Vol. 1, pp. 281-297).
Núñez Delafuente, J., López, M., & García, R. (2024). Ensemble approach using k-partitioned Isolation Forests for the detection of stock market manipulation. Mathematics, 12(9), 1336. https://doi.org/10.3390/math12091336.
Schölkopf, B., Platt, J. C., Shawe-Taylor, J., Smola, A. J., & Williamson, R. C. (2001). Estimating the support of a high-dimensional distribution. Neural Computation, 13(7), 1443–1471.
Shyu, C. R., Chen, S. C., Sarinnapakorn, K., & Chang, L. (2003). A novel anomaly detection scheme based on principal component classifier. International Journal of Automation and Smart Technology, Vol. 2, No. 1, pp. 119-130.
Sinap, V. (2024). Makine Öğrenmesinde Temel Yaklaşımlar ve Gelişen Eğilimler. E. Tekin & İ. Ç. Tekin (Eds.), Yönetim Bilişim Sistemlerinde Güncel Konular. Eğitim Yayınevi.
Song, X., Wu, M., & Jermaine, C. (2007). Conditional anomaly detection. IEEE Transactions on Knowledge and Data Engineering, 19(5), 631–645. https://doi.org/10.1109/TKDE.2007.1015.
Tang, J., Chen, Z., Fu, A. W., & Cheung, D. W. (2002). Enhancing effectiveness of outlier detection for low selectivity data sets. In Proceedings of the 6th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD), pp. 535-548.
Tax, D. M. J., & Duin, R. P. W. (2004). Support Vector Data Description. Machine Learning, 54(1), 45–66.
Türkoğlu, D. (2024). BIST 100'de Anomali Keşfi: One-Class SVM, Rastgele Orman ve Karar Ağacı ile Etkin Piyasa Analizi. Aypek, N., & Karakoç, B. (Ed.), Güncel Finansal Çalışmalar: Teori, Uygulama ve Analizler (ss. 36-62). Bidge Yayınları.
Yeh, C., Zhu, Y., Ulanova, L., Begum, N., Ding, Y., Dau, H. A., Silva, D. F., Mueen, A., & Keogh, E. J. (2016). Matrix Profile I: All Pairs Similarity Joins for Time Series: A Unifying View That Includes Motifs, Discords and Shapelets. 2016 IEEE 16th International Conference on Data Mining (ICDM), 1317–1322.
Zhou, Z.-H., & Paffenroth, R. C. (2017). Anomaly detection with robust deep autoencoders. Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 665–674.