Lazy evaluation과 이터레이터

Rust에서 이터레이터는 기본적으로 게으른(lazy) 평가 방식을 따른다. 이는 이터레이터가 정의되고 각종 연산자를 통해 변환(예: map, filter 등)되는 순간에 곧바로 모든 연산이 수행되는 것이 아니라, 실제로 데이터를 필요로 하는 시점에만 평가가 일어나는 특성을 의미한다. 게으른 평가가 가능해지려면 클로저를 통해 매핑 또는 필터링과 같은 단계적 연산의 로직을 미리 정의해 두고, 소비(consume) 시점에만 해당 연산을 실제로 실행하여 최종 결과물을 산출해야 한다. Rust의 이터레이터들은 이러한 방식을 통해 메모리와 계산 리소스를 효율적으로 사용한다.

게으른 평가가 적용되는 이터레이터를 만드는 전형적인 예로 map이나 filter와 같은 어댑터(adapter)를 생각해볼 수 있다. 예를 들어, 어떤 벡터를 map으로 변환하는 코드를 작성했다고 해서 그 순간에 즉시 모든 원소에 함수를 적용하는 것은 아니다. 실제로는 새로운 이터레이터(즉, map을 통해 만들어진 어댑터)가 반환될 뿐이며, 그 이터레이터는 원 소스에 대한 참조 및 변환 클로저를 내부에 담고 있을 뿐이다. 이 후 collect나 for 루프 같은 소비자(consumer) 연산을 만나기 전까지는 실제 변환이 수행되지 않는다. 이러한 작동 방식을 보면 이터레이터는 내부적으로 next 메서드를 통해 한 번에 하나씩 원소를 꺼내면서 미리 정의된 변환 클로저를 적용하고, 그 결과를 내보내는 동작을 수행한다.

게으른 평가의 대표적인 장점은 적은 메모리 사용과 불필요한 계산의 방지다. 예를 들어, 대량의 데이터를 처리해야 하는 경우라고 해보면, 모든 데이터를 한꺼번에 복사하고 변환하는 eager 방식은 많은 메모리와 연산 시간을 필요로 할 수 있다. 반면 Rust의 이터레이터는 실제로 결과가 필요할 때마다 원소를 하나씩 계산하기 때문에 중간 결과를 대규모로 저장할 필요가 줄어든다. 또한 필요한 범위보다 더 많이 계산하지 않으므로, 무의미한 중간 연산이 최소화될 수 있다.

이터레이터의 next 메서드는 표준 라이브러리에서 Iterator 트레이트를 통해 정의된다. 이 메서드는 호출될 때마다 Option를 반환하고, 이는 현재 처리해야 할 값이 있으면 Some(...)을, 더 이상 처리할 값이 없으면 None을 나타낸다. 따라서 이터레이터는 실제로 next가 불릴 때만 내부 상태를 갱신하고, 그것이 곧 게으른 평가를 실현하는 기저 원리다. 이를 바탕으로 스스로 정의한 구조체에 Iterator 트레이트를 구현하면 원하는 방식의 게으른 순회 로직을 작성할 수도 있다.

이터레이터 어댑터와 소비자 연산의 조합은 게으른 평가의 핵심이다. map, filter, take, skip 등은 모두 어댑터로서 기존 이터레이터를 받아 새로운 이터레이터를 반환할 뿐이므로, 그 자체로는 실제 데이터를 소비하지 않는다. 최종적으로 collect, fold, sum, for 루프 등을 통해 이터레이터가 실질적으로 소비되는 시점에만 내부의 클로저가 실행된다. 아래 코드는 이를 간단히 보여주는 예다.

fn main() {
    let numbers = 1..=5;
    let squared_numbers = numbers
        .map(|x| {
            println!("map 호출: {}", x);
            x * x
        });

    println!("map 호출 전에는 아무것도 출력되지 않았다.");
    let collected: Vec<i32> = squared_numbers.collect();
    println!("최종 결과: {:?}", collected);
}

이 코드에서 map 클로저에 println!이 들어 있음에도, squared_numbers가 만들어지는 시점에는 아무것도 출력되지 않는다. 이는 Rust의 이터레이터가 게으른 평가를 사용하기 때문이다. 실제로 값을 소비(collect)하는 순간이 되어서야 map 클로저가 실행되어 각 원소를 변환하고, 그 과정에서 println!이 호출되는 것을 확인할 수 있다.

이러한 게으른 평가 방식은 Rust의 안전성(safety), 메모리 효율성, 그리고 성능 최적화와 긴밀하게 연결된다. Rust 컴파일러는 모자이크처럼 이어지는 이터레이터 연산들을 하나로 엮어서 불필요한 메모리 할당이나 연산을 줄이도록 최적화를 시도한다. 예컨대 여러 개의 map과 filter 체인이 있더라도, 실제로는 각 원소가 한 번씩만 순회되면서 연속적으로 모든 연산을 처리할 수 있다. 이를 ‘퓨전(fusion) 최적화’라고도 부르며, 이 과정을 통해 이터레이터 체인이 아주 긴 경우에도 성능 저하 없이 수행될 수 있다.

이터레이터가 클로저와 함께 게으른 평가를 구현할 때, 주의할 점은 클로저가 캡처하는 외부 변수들의 생존 주기(lifetime)와 가변성(mutability)에 관한 것이다. map이나 filter 같은 이터레이터 어댑터는 보통 불변 참조 캡처를 사용하지만, 필요에 따라 가변 참조가 요구될 수도 있다. 이때 Rust의 엄격한 빌림(ownership and borrowing) 규칙이 적용되어, 클로저 내부에서 외부 변수를 어떻게 사용할 수 있는지를 정확히 제어하게 된다. 이러한 제약은 안전성을 높이는 동시에, 이터레이터와 클로저가 복잡하게 얽혔을 때도 프로그램이 의도치 않게 메모리를 오염시키거나 경쟁 상태(race condition)에 빠지는 것을 방지해준다.

고성능 요구 사항을 가진 상황에서 게으른 이터레이터의 사용은 여러 이점을 제공하지만, 모든 상황에서 항상 최적의 선택이 되는 것은 아니다. 내부 상태를 계속 변환하며 저장해야 하거나, 외부와의 상호 작용에 따라 즉시 결과가 필요한 경우에는 eager 방식이 더 단순하고 직관적일 수 있다. 그러나 Rust 표준 라이브러리에서 제공하는 대부분의 이터레이터들은 게으른 평가를 전제로 설계되어 있으며, 이로 인해 클로저와 결합하여 상당히 유연한 구성 방식을 제공한다. 특히 반복되는 중간 결과 처리를 하지 않아도 된다는 점, 그리고 결과를 사용하는 시점까지 연산을 늦출 수 있다는 점이 Rust 이터레이터 모델의 강점이다.

게으른 평가가 채택된 이터레이터 모델을 이해하면, 더욱 효율적인 Rust 코드를 작성할 수 있다. 필요 이상으로 데이터를 복사하지 않고, 원하는 시점에만 연산을 수행하기 때문에 속도와 메모리 사용 면에서 최적화를 기대할 수 있다. 또한, 이터레이터 체인을 만들 때 여러 클로저를 쉽게 병렬화하거나, 특정 조건에 맞게 동작을 확장할 수도 있다. Rust의 트레이트 시스템 덕분에 개발자가 직접 Iterator를 구현하거나, 어댑터가 되었든 소비자 연산이 되었든 새로운 메서드를 만드는 것도 가능하다.

게으른 평가가 어떻게 이터레이터에 적용되는지 개념을 명확히 이해하고 있으면, Rust의 다양한 표준 라이브러리 함수를 더욱 효과적으로 사용할 수 있다. 결과적으로 클로저를 통해 원하는 동작을 유연하게 캡슐화하고, 이터레이터 체인을 통해 게으르게 소비하는 구조는 함수형 프로그래밍의 장점을 적극 활용하는 좋은 예다. Rust는 이러한 패러다임을 컴파일 타임 안전성과 결합하여 강력하면서도 효율적인 애플리케이션 개발을 지원한다.

Previous이터레이터 소비자(sum, count, etc)Nextchapter_10

Last updated 1 year ago