AI 음악 툴을 처음 쓰다가 포기하는 사람들의 공통적인 패턴이 있다. 프롬프트를 대충 쓰고, 결과물이 기대에 못 미치면 AI가 별로라고 결론 내리는 거다. 근데 실제로는 툴의 문제가 아니라 프롬프트의 문제인 경우가 대부분이다.
프롬프트를 어떻게 쓰냐에 따라 같은 툴에서 완전히 다른 수준의 결과물이 나온다. 제대로 된 프롬프트 하나면 처음 들었을 때 진짜 사람이 만든 거 같다는 말이 나오는 곡이 나오고, 대충 쓴 프롬프트는 어딘가 어색하고 밋밋한 곡을 만들어낸다.
좋은 프롬프트에는 반드시 들어가야 하는 요소들이 있다.
장르는 가장 기본이다. lo-fi, jazz, k-pop, indie rock, classical, ambient 같은 명확한 장르 키워드가 들어가야 AI가 방향을 잡는다.
템포는 곡의 에너지를 결정한다. slow, medium, fast로 표현해도 되고, 구체적인 BPM 숫자를 넣어도 된다. 집중력 향상 음악을 만들고 싶다면 70-80 BPM 정도가 적당하고, 운동할 때 듣는 음악은 130-150 BPM이 맞다.
악기 구성은 곡의 색깔을 만든다. acoustic guitar, electric piano, string quartet, synthesizer, drum kit 같은 식으로 원하는 악기를 나열하면 된다. 악기를 많이 나열한다고 다 들어가는 건 아니지만, 방향을 잡아주는 역할을 한다.
분위기와 감정은 곡이 주는 느낌을 결정한다. melancholic, uplifting, dark, cozy, nostalgic, aggressive 같은 형용사들이 여기에 해당한다. 이게 없으면 곡에 감정이 없는 느낌이 난다.
보컬 여부와 스타일도 명시해줘야 한다. 보컬이 없는 순수 instrumental을 원한다면 “no vocals, instrumental only”를 넣어줘야 한다. 안 넣으면 보컬이 들어가는 경우가 많다.
Lo-fi 힙합을 만들 때는 이렇게 쓴다.
“lo-fi hip hop, 75 BPM, jazzy piano chords, mellow bass, soft drum loops, vinyl record crackle, rain sounds in background, late night study atmosphere, no vocals, warm and nostalgic”
재즈 곡을 만들 때는 이렇게 쓴다.
“modern jazz, upright bass, brushed drums, piano trio, 120 BPM, improvised feel, smoky bar atmosphere, late night, sophisticated, instrumental”
감성적인 팝 발라드를 만들 때는 이렇게 쓴다.
“emotional pop ballad, female vocalist, soft piano, subtle strings, 70 BPM, heartbreak theme, intimate recording, breathy vocal tone, building chorus”
공부할 때 듣는 ambient 음악을 만들 때는 이렇게 쓴다.
“ambient study music, soft piano, gentle synthesizer pads, nature sounds, 60 BPM, concentration, calm and focused, no sudden changes, smooth and continuous”
특정 아티스트 이름을 넣는 건 피하는 게 좋다. 저작권 문제도 있고, 생각보다 그 아티스트 느낌이 잘 안 나오는 경우도 많다. 아티스트 이름 대신 그 아티스트의 음악적 특성을 묘사하는 방식이 낫다. 예를 들어 특정 가수 이름 대신 “husky female voice, emotional storytelling, acoustic guitar, intimate recording style”처럼 쓰는 거다.
너무 많은 걸 한꺼번에 넣는 것도 문제다. 장르를 여러 개 넣거나 서로 상충하는 분위기를 동시에 요구하면 결과물이 방향을 못 잡고 어중간하게 나온다. 하나의 명확한 방향을 잡고 그에 맞는 디테일을 추가하는 방식이 낫다.
처음 나온 결과가 마음에 안 드는 경우가 대부분이다. 이때 프롬프트를 어떻게 수정하느냐가 핵심이다.
결과물이 너무 밝게 나왔다면 dark, melancholic, minor key 같은 키워드를 추가한다. 너무 시끄럽게 나왔다면 subtle, gentle, soft, minimalist 같은 키워드를 넣는다. 보컬이 너무 강하게 들린다면 background vocals, soft harmony, distant vocals 같은 표현으로 조절한다.
같은 프롬프트로 여러 번 생성해보는 것도 방법이다. 같은 프롬프트라도 생성할 때마다 다른 결과가 나오기 때문에, 마음에 드는 버전이 나올 때까지 여러 번 돌려보는 게 현실적이다.