MÜZİK ARAŞTIRMALARINDA SES İÇERİK ANALİZİ

Author:

Year-Number: 2023-136
Yayımlanma Tarihi: 2023-01-17 21:49:22.0
Language : Türkçe
Konu : Müzik
Number of pages: 282-297
Mendeley EndNote Alıntı Yap

Abstract

Ses içerik analizi yöntemleri müzikten bilgi çıkarımı çalışmalarının gerçekleştirilmesine imkân sağlayan bir temel araştırma alanıdır. Aslen ses tanımlama literatüründen yararlanan bu alan mühendislik ve müzik alanlarını bir araya getiren disiplinler arası çalışmalar ile ilerlemektedir. Ancak yapılan çalışmaların fen bilimleri perspektifinde temellenmesi müzik alanındaki araştırmacıların ses içerik analizi imkanlarından yararlanmalarını zorlaştırmaktadır. Bu çalışmanın amacı müzik araştırmacılarına ses içerik analizinde kullanılan öznitelikler hakkında bilgi vermek ve özniteliklerin farklı ses kaynakları için değişimlerini kıyaslayarak göstermektir. Bu çalışmada, ilk olarak sayısal sinyal ile ilgili temel kavramlar verildikten sonra, ses içerik analizi ve ilgili literatürün temel kavramları olan sinyal gösterimi (dalga formu ve izge göstergeler), öznitelikler, özniteliklerin temsiliyetleri (zaman-izge) tanıtılmıştır. Zamansal (Sıfır geçiş sayısı, RMS enerji, enerji dağıntı) ve izgesel (izgesel merkez, izgesel yayılma, izgesel dağıntı, izgesel akış, izgesel etek noktası, MFCC, doygunluk vektörü) özniteliklerin yanı sıra, harmonik oran ve perde öznitelikler de açıklanmıştır. Ardından zamansal ve izgesel öznitelikler, bir müzik projesinin aynı uzunluktaki dört farklı ses kanalından (akustik gitar, davul seti, bas ve solist) alınan örnekler ile kıyaslanmıştır. Her bir öznitelik grafiği söz konusu dört ses kanalı için değişimleri yorumlanmıştır. Sonuç olarak bu çalışmanın sınırlılıkları içerisinde sıfır geçiş sayısı, RMS enerji, izgesel merkez, izgesel dağıntı, izgesel etek noktası ve MFCC özniteliklerinin, mevcut ses dosyaları gibi farklı kaynakları belirlemede önemli olduğu gözlemlenmiştir.

Keywords

Abstract

Audio content analysis is a research field that comprises diverse research approaches to carry on music information retrieval studies. This field primarily benefits from sound recognition literature and proceeds as an interdisciplinary research field that brings together engineering and music. However, audio content analysis following an engineering perspective it makes harder to be applied by music researchers. The aim of this study is to provide basic information about audio features to music researchers by showing how the audio features vary among different sound sources. In this study, after giving the fundamental concepts of digital signal, presentations of the signal (waveform and spectrogram), audio features, and audio feature presentations in time and frequency domains were demonstrated. Besides the temporal (zero crossing rate, RMS energy, energy entropy) and spectral (spectral centroid, spectral spread, spectral entropy, spectral flux, spectral roll-off, MFCC, chroma vector) features, harmonic ratio and pitch features are also explained. These temporal and spectral features were analyzed and compared one by one with five seconds excerpts that were taken from four audio tracks (acoustic guitar, drum set, bass, and vocal). Results of individual audio features for the audio files are given in graphics for interpretation. As a result, it is observed that the utilization of zero crossing rate, RMS energy, spectral centroid, spectral entropy, spectral roll-off, and MFCC audio features provide a foundation to successfully estimate different audio sources such as the available audio files in this study’s scope and limitations.

Keywords