Pohon urai atau pohon sintaksis (Inggris: parse tree) adalah struktur data pohon yang simpul-simpulnya merepresentasikan struktur sintaksis dari sebuah string sesuai dengan suatu tata bahasa . Istilah pohon urai sendiri digunakan terutama dalam komputasi linguistik. Dalam sintaksis teoretis, istilah pohon sintaksis lebih umum digunakan.
Pohon urai biasanya dibangun bedasarkan hubungan konstituen dalam tata bahasa berstruktur frasa (phrase structure grammar) atau bedasarkan hubungan keterkaitan dari tata bahasa keterkaitan (dependency grammar). Pohon urai dapat digunakan untuk mengurai bahasa alami, ataupun untuk memproses bahasa komputer, seperti bahasa pemrograman.
Pohon urai terdiri dari simpul dan cabang.[1] Dalam contoh gambar, struktur data pohon adalah struktur keseluruhan dari pohon urai, dengan S sebagai simpul ayah, NP dan VP sebagai simpul anak dari S dan juga sebagai simpul ayah dari simpul-simpul anak yang berada di bawahnya, dan begitu seterusnya.[2].
Fungsi terminal adalah simbol atau fungsi yang tidak dapat lagi dipecah, yaitu simpul anak paling bawah. Sedangkan, fungsi nonterminal adalah fungsi yang masih dapat dipecah dan dirumuskan menjadi fungsi terminal, seperti S, NP, dst. Atau dalam kata lain, fungsi nonterminal adalah simpul dalam dari pohon urai.[3][4]
Pohon urai berbasis hubungan konstituen (constituency-based)
Pohon urai berbasis hubungan konstituen membedakan antara simpul terminal dan simpul nonterminal. Simpul-simpul anak paling bawah ditandai sebagai simpul terminal, sedangkan simpul-simpul dalam ditandai sebagai simpul nonterminal. Gambar di bawah ini menunjukkan contoh pohon urai berbasis hubungan konstituen dari kalimat bahasa Inggris "John hit the ball":
Pada gambar tersebut, simpul S adalah simpul akar, yaitu simpul ayah dari segala simpul. Simpul akar tidak mempunyai cabang di atasnya, dan dalam suatu kalimat, hanya ada satu simpul akar. Sedangkan simpul cabang adalah simpul ayah yang menghubungkan dua simpul anak atau lebih (seperti VP, NP). Lalu simpul daun adalah simpul yang tidak mempunyai cabang apapun di bawahnya (seperti N, V, D, N). Daun-daun dari simpul-simpul daun adalah token leksikon dari kalimat.
Pohon urai berbasis hubungan keterkaitan (dependency-based)
Pohon urai berbasis hubungan keterkaitan menetapkan semua simpul sebagai simpul terminal. Artinya pohon urai jenis ini tidak membedakan antara simpul terminal dan simpul nonterminal. Pohon urai berbasis hubungan keterkaitan terlihat lebih sederhana dari jenis yang sebelumnya karena mereka mempunyai simpul yang lebih sedikit. Berikut adalah contoh dari pohon urai berbasis hubungan keterkaitan dari kalimat sebelumnya:
Dapat dilihat bahwa pohon urai berbasis hubungan keterkaitan tidak mempunyai simpul N, VP, V, dan NP yang ada pada pohon urai berbasis hubungan konstituen. Akan tetapi, struktur konstituen dalam kalimat tetap dapat dikenali. Dari sini, dapat diketahui bahwa pohon urai berbasis hubungan keterkaitan tetap mengenali subjek John dan objek ball pada contoh sebagai dua konstituen, sama dengan pohon urai berbasis hubungan konstituen tadi.
Karena sebab ini, masih diperdebatkan apakah pembagian pohon urai ke dalam dua jenis ini mempunyai suatu keharusan atau manfaat tertentu.
Referensi
Artikel bertopik linguistika ini adalah sebuah rintisan. Anda dapat membantu Wikipedia dengan mengembangkannya.