Chonkie Documentation

Sentence Chunker

curl --request POST \
  --url https://api.example.com/v1/chunk/sentence

{
  "text": "<string>",
  "start_index": 123,
  "end_index": 123,
  "token_count": 123
}

Sentence Chunker

curl --request POST \
  --url https://api.example.com/v1/chunk/sentence

{
  "text": "<string>",
  "start_index": 123,
  "end_index": 123,
  "token_count": 123
}

The Sentence Chunker splits text at sentence boundaries, ensuring chunks contain complete sentences for better readability.

Examples

Text Input

from chonkie.cloud import SentenceChunker

chunker = SentenceChunker(
    chunk_size=512,
    min_sentences_per_chunk=2
)

text = "Your text here..."
chunks = chunker.chunk(text)

File Input

from chonkie.cloud import SentenceChunker

chunker = SentenceChunker(
    chunk_size=512,
    min_sentences_per_chunk=2
)

# Chunk from file
with open("document.txt", "rb") as f:
    chunks = chunker.chunk(file=f)

Request

Parameters

text

string | string[]

The text to chunk. Can be a single string or an array of strings for batch processing. Either text or file is required.

file

File to chunk. Use multipart/form-data encoding. Either text or file is required.

tokenizer

string

default:"gpt2"

Tokenizer to use for counting tokens.

chunk_size

integer

default:"512"

Maximum number of tokens per chunk.

chunk_overlap

integer

default:"0"

Number of tokens to overlap between consecutive chunks.

min_sentences_per_chunk

integer

default:"1"

Minimum number of sentences to include in each chunk.

Response

Returns

Array of Chunk objects, each containing:

text

string

The chunk text content.

start_index

integer

Starting character position in the original text.

end_index

integer

Ending character position in the original text.

token_count

integer

Number of tokens in the chunk.

Token Chunker

Recursive Chunker

⌘I

Getting Started

Chunkers

Refineries

Pipelines

Knowledge Bases

Search

Agents

Parse

Sentence Chunker

Examples

Text Input

File Input

Request

Parameters

Response

Returns

Getting Started

Chunkers

Refineries

Pipelines

Knowledge Bases

Search

Agents

Parse

​Examples

​Text Input

​File Input

​Request

​Parameters

​Response

​Returns

Examples

Text Input

File Input

Request

Parameters

Response

Returns