Les protéines de liaison à l'ARN (souvent abrégées RBP, pour RNA-binding protein, en anglais) sont des protéines qui se lient à l'ARN double ou simple brin dans les cellules et participent à la formation de complexes de ribonucléoprotéines. Les RBP contiennent divers motifs structurels, tels que le motif de reconnaissance d'ARN (RRM, pour RNA recognition motif, en anglais), le domaine de liaison à l'ARNdb, le motif de doigt de zinc et autres. Ce sont des protéines cytoplasmiques et nucléaires. Cependant, étant donné que la plupart des ARN matures sont exportés du noyau relativement rapidement, la plupart des RBP localisées dans le noyau se présentent sous la forme de complexes de protéines et de pré-ARNm appelés particules de ribonucléoprotéines hétérogènes (hnRNP). Les RBP jouent un rôle crucial dans divers processus cellulaires tels que la fonction cellulaire, le transport et la localisation. Elles jouent notamment un rôle majeur dans le contrôle post-transcriptionnel des ARN, tels que l'épissage, la polyadénylation, la stabilisation de l'ARNm, la localisation et la traduction de l'ARNm. Les cellules eucaryotes codent diverses RBP, environ 500 gènes, avec une activité unique de liaison à l'ARN et une interaction protéine-protéine. Au cours de l'évolution, la diversité des RBP s'est considérablement accrue avec l'augmentation du nombre d'introns. Cette diversité a permis aux cellules eucaryotes d’utiliser des exons d’ARN dans divers arrangements, ce qui a donné lieu à une ribonucléoprotéine (RNP) unique pour chaque ARN. Bien que les RBP jouent un rôle crucial dans la régulation post-transcriptionnelle de l'expression des gènes, relativement peu de RBP ont été étudiées de manière systématique.
De nombreuses RBP ont des structures modulaires et sont composées de répétitions multiples de quelques domaines de base spécifiques ayant souvent un nombre de séquences limité. Ces séquences sont ensuite organisées en combinaisons variées pour répondre au besoin de diversité.