En phonétique et en phonologie, le terme semi-voyelle désigne un type de phone (son) intermédiaire entre consonne et voyelle, qui présente des traits de l'une et de l'autre. Autrement dit, ce n'est ni une consonne, ni une voyelle. Une autre définition affirme également ce caractère intermédiaire mais aussi que la semi-voyelle est une voyelle qu'on ne peut prononcer qu'avec une autre voyelle dans une même syllabe. En français, de tels phones sont [j] (par exemple dans les mots pied, fille, [w] (dans oui) et [ɥ] (dans nuit).
À part cette définition générale, le son appelé semi-voyelle a diverses interprétations du point de vue dont il est considéré : seulement phonétique ou aussi phonologique. Les linguistiques des diverses langues le traitent aussi en fonction des rôles phonologiques qu'il a ou n'a pas dans la langue considérée.
L'interprétation traditionnelle de ce type de son prend en considération plutôt son aspect phonétique que celui phonologique. Dans une interprétation plus nouvelle, le point de vue phonologique est important. Dans celle-ci, certains auteurs considèrent que ce terme est imprécis, par conséquent obsolète, et lui préfèrent le terme anglais glide. Dans le langage anglais courant, ce mot signifie « glissement » et, en phonétique, il désigne un son de transition produit par les organes articulatoires lorsqu'ils s'approchent ou s'éloignent de l'articulation d'un autre son. À noter cependant que dans la linguistique de l'anglais, certains auteurs considèrent le terme glide dans ce sens, mais aussi comme un synonyme de diphthong, qu'ils définissent comme une voyelle dont l'articulation glisse de celle d'une voyelle à celle d'une autre.
Les phones appelés semi-voyelles ont des caractéristiques d'articulation communes aux voyelles et aux consonnes. Leur structure acoustique est proche de celle de voyelles qui leur correspondent. En français, ce sont [i], [u] et [y]. Dans certaines positions, ils peuvent être prononcés soit comme tels, soit comme leurs correspondantes voyelles, ex. louer [lwe] en débit rapide vs [lu.