En linguistique, un mot composé est une juxtaposition de deux lexèmes libres permettant d'en former un troisième qui soit un lemme (« mot ») à part entière et dont le sens ne se laisse pas forcément deviner par celui des deux constituants. Ainsi, un garde-fou est, en français, un lemme indépendant de garde et de fou dont le sens de « balustrade de protection sur un pont, près d'un fossé, empêchant de tomber » ne peut être deviné. En mandarin, d'autre part, 東西/东西 dōngxī, « chose », est un mot composé de 東/东 dōng, « est [point cardinal] », et 西 xī, « ouest », dont le sens n'est pas non plus prévisible.
Ainsi, un mot composé étant un lemme à part entière, il est recensé par les dictionnaires, ce qui permet de le distinguer d'un syntagme (petit-lait est un mot composé synonyme de lactosérum, pas petit chat). Dans les langues à accent tonique, les mots composés peuvent subir l'univerbation, ce qui permet aussi de les distinguer.
En dernière analyse, un mot composé se réduit toujours à deux éléments. Chacun de ces constituants peut lui-même être un mot composé. Le plus souvent, les deux éléments forment un couple déterminant /déterminé + détermination.
Selon que le sens du mot composé ne fait intervenir implicitement aucun autre élément nécessaire à sa compréhension ou, au contraire, qu'il faut supposer un élément extérieur, on parle, respectivement, de composés endocentriques (très majoritaires) ou exocentriques (moins nombreux et essentiellement combinatoires). Par exemple, oiseau-mouche est endocentrique (c'est un oiseau qui est comme une mouche : la périphrase se contente des éléments présents) tandis que rouge-gorge est exocentrique (c'est un oiseau qui a la gorge rouge : l'élément oiseau n'est pas présent).
D'autre part, le mot composé permettant l'économie syntaxique (parce qu'il remplace une construction syntaxique plus complexe), le lien syntaxique qui lie les deux éléments permet d'en déterminer le sous-type.