How can I save partitioned Parquet ? #3737

Miyake-Diogo · 2022-10-06T15:28:53Z

Miyake-Diogo
Oct 6, 2022

How can I save partitioned parquet like apache spark?

Oct 10, 2022

    let ctx = SessionContext::new();
    ctx
        .read_csv("data.csv", CsvReadOptions::default().has_header(true)).await?
        .repartition(Partitioning::Hash(vec![col("id")], 2))?
        .write_parquet("data.parquet", None).await?;

View full answer

andygrove · 2022-10-10T12:52:08Z

andygrove
Oct 10, 2022
Collaborator

Have you tried calling write_parquet on a DataFrame?

https://arrow.apache.org/datafusion/user-guide/dataframe.html

1 reply

Miyake-Diogo Oct 10, 2022
Author

Yes..

andygrove · 2022-10-10T13:40:28Z

andygrove
Oct 10, 2022
Collaborator

    let ctx = SessionContext::new();
    ctx
        .read_csv("data.csv", CsvReadOptions::default().has_header(true)).await?
        .repartition(Partitioning::Hash(vec![col("id")], 2))?
        .write_parquet("data.parquet", None).await?;

1 reply

Miyake-Diogo Oct 10, 2022
Author

Thanks it's work

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

How can I save partitioned Parquet ? #3737

{{title}}

Replies: 2 comments 2 replies

{{title}}

{{title}}

{{title}}

{{title}}

Select a reply

How can I save partitioned Parquet ? #3737

Miyake-Diogo Oct 6, 2022

Replies: 2 comments · 2 replies

andygrove Oct 10, 2022 Collaborator

Miyake-Diogo Oct 10, 2022 Author

andygrove Oct 10, 2022 Collaborator

Miyake-Diogo Oct 10, 2022 Author

Miyake-Diogo
Oct 6, 2022

Replies: 2 comments 2 replies

andygrove
Oct 10, 2022
Collaborator

Miyake-Diogo Oct 10, 2022
Author

andygrove
Oct 10, 2022
Collaborator

Miyake-Diogo Oct 10, 2022
Author