twitch-dl/twitchdl/playlists.py

"""
Parse and manipulate m3u8 playlists.
"""

from dataclasses import dataclass
from typing import Generator, List, Optional, OrderedDict

import click
import m3u8

from twitchdl import utils
from twitchdl.output import bold, dim


@dataclass
class Playlist:
    name: str
    group_id: str
    resolution: Optional[str]
    url: str
    is_source: bool


@dataclass
class Vod:
    index: int
    """Ordinal number of the VOD in the playlist"""
    path: str
    """Path part of the VOD URL"""
    duration: int
    """Segment duration in seconds"""


def parse_playlists(playlists_m3u8: str) -> List[Playlist]:
    def _parse(source: str) -> Generator[Playlist, None, None]:
        document = load_m3u8(source)

        for p in document.playlists:
            resolution = (
                "x".join(str(r) for r in p.stream_info.resolution)
                if p.stream_info.resolution
                else None
            )

            media = p.media[0]
            is_source = media.group_id == "chunked"
            yield Playlist(media.name, media.group_id, resolution, p.uri, is_source)

    return list(_parse(playlists_m3u8))


def load_m3u8(playlist_m3u8: str) -> m3u8.M3U8:
    return m3u8.loads(playlist_m3u8)


def enumerate_vods(
    document: m3u8.M3U8,
    start: Optional[int] = None,
    end: Optional[int] = None,
) -> List[Vod]:
    """Extract VODs for download from document."""
    vods = []
    vod_start = 0

    for index, segment in enumerate(document.segments):
        vod_end = vod_start + segment.duration

        # `vod_end > start` is used here becuase it's better to download a bit
        # more than a bit less, similar for the end condition
        start_condition = not start or vod_end > start
        end_condition = not end or vod_start < end

        if start_condition and end_condition:
            vods.append(Vod(index, segment.uri, segment.duration))

        vod_start = vod_end

    return vods


def make_join_playlist(
    playlist: m3u8.M3U8,
    vods: List[Vod],
    targets: List[str],
) -> m3u8.Playlist:
    """
    Make a modified playlist which references downloaded VODs
    Keep only the downloaded segments and skip the rest
    """
    org_segments = playlist.segments.copy()

    path_map = OrderedDict(zip([v.path for v in vods], targets))
    playlist.segments.clear()
    for segment in org_segments:
        if segment.uri in path_map:
            segment.uri = path_map[segment.uri]
            playlist.segments.append(segment)

    return playlist


def select_playlist(playlists: List[Playlist], quality: Optional[str]) -> Playlist:
    return (
        select_playlist_by_name(playlists, quality)
        if quality is not None
        else select_playlist_interactive(playlists)
    )


def select_playlist_by_name(playlists: List[Playlist], quality: str) -> Playlist:
    if quality == "source":
        for playlist in playlists:
            if playlist.is_source:
                return playlist
        raise click.ClickException("Source quality not found, please report an issue on github.")

    for playlist in playlists:
        if playlist.name == quality or playlist.group_id == quality:
            return playlist

    available = ", ".join([p.name for p in playlists])
    msg = f"Quality '{quality}' not found. Available qualities are: {available}"
    raise click.ClickException(msg)


def select_playlist_interactive(playlists: List[Playlist]) -> Playlist:
    click.echo("\nAvailable qualities:")
    for n, playlist in enumerate(playlists):
        if playlist.resolution:
            click.echo(f"{n + 1}) {bold(playlist.name)} {dim(f'({playlist.resolution})')}")
        else:
            click.echo(f"{n + 1}) {bold(playlist.name)}")

    no = utils.read_int("Choose quality", min=1, max=len(playlists) + 1, default=1)
    playlist = playlists[no - 1]
    return playlist
Extract playlist parsing code 2024-04-06 08:15:26 +00:00			`"""`
			`Parse and manipulate m3u8 playlists.`
			`"""`

			`from dataclasses import dataclass`
Hopefully fix python 3.8 compat 2024-04-23 16:09:30 +00:00			`from typing import Generator, List, Optional, OrderedDict`
Extract playlist parsing code 2024-04-06 08:15:26 +00:00
			`import click`
			`import m3u8`

			`from twitchdl import utils`
			`from twitchdl.output import bold, dim`


			`@dataclass`
			`class Playlist:`
			`name: str`
Improve playlist parsing Better support for "enhanced broadcast" streams issue #154 2024-04-27 18:04:40 +00:00			`group_id: str`
Remove union types to fix python 3.8 compat 2024-04-23 15:14:27 +00:00			`resolution: Optional[str]`
Extract playlist parsing code 2024-04-06 08:15:26 +00:00			`url: str`
Improve playlist parsing Better support for "enhanced broadcast" streams issue #154 2024-04-27 18:04:40 +00:00			`is_source: bool`
Extract playlist parsing code 2024-04-06 08:15:26 +00:00

			`@dataclass`
			`class Vod:`
			`index: int`
			`"""Ordinal number of the VOD in the playlist"""`
			`path: str`
			`"""Path part of the VOD URL"""`
			`duration: int`
			`"""Segment duration in seconds"""`


Improve typing 2024-04-24 06:11:33 +00:00			`def parse_playlists(playlists_m3u8: str) -> List[Playlist]:`
Extract playlist parsing code 2024-04-06 08:15:26 +00:00			`def _parse(source: str) -> Generator[Playlist, None, None]:`
			`document = load_m3u8(source)`

			`for p in document.playlists:`
Improve playlist parsing Better support for "enhanced broadcast" streams issue #154 2024-04-27 18:04:40 +00:00			`resolution = (`
			`"x".join(str(r) for r in p.stream_info.resolution)`
			`if p.stream_info.resolution`
			`else None`
			`)`
Extract playlist parsing code 2024-04-06 08:15:26 +00:00
Improve playlist parsing Better support for "enhanced broadcast" streams issue #154 2024-04-27 18:04:40 +00:00			`media = p.media[0]`
			`is_source = media.group_id == "chunked"`
			`yield Playlist(media.name, media.group_id, resolution, p.uri, is_source)`
Extract playlist parsing code 2024-04-06 08:15:26 +00:00
Improve playlist parsing Better support for "enhanced broadcast" streams issue #154 2024-04-27 18:04:40 +00:00			`return list(_parse(playlists_m3u8))`
Extract playlist parsing code 2024-04-06 08:15:26 +00:00

			`def load_m3u8(playlist_m3u8: str) -> m3u8.M3U8:`
			`return m3u8.loads(playlist_m3u8)`


Fix tests 2024-04-10 06:04:21 +00:00			`def enumerate_vods(`
			`document: m3u8.M3U8,`
Remove union types to fix python 3.8 compat 2024-04-23 15:14:27 +00:00			`start: Optional[int] = None,`
			`end: Optional[int] = None,`
Hopefully fix python 3.8 compat 2024-04-23 16:09:30 +00:00			`) -> List[Vod]:`
Extract playlist parsing code 2024-04-06 08:15:26 +00:00			`"""Extract VODs for download from document."""`
			`vods = []`
			`vod_start = 0`

			`for index, segment in enumerate(document.segments):`
			`vod_end = vod_start + segment.duration`

			# `vod_end > start` is used here becuase it's better to download a bit
			`# more than a bit less, similar for the end condition`
			`start_condition = not start or vod_end > start`
			`end_condition = not end or vod_start < end`

			`if start_condition and end_condition:`
			`vods.append(Vod(index, segment.uri, segment.duration))`

			`vod_start = vod_end`

			`return vods`


			`def make_join_playlist(`
			`playlist: m3u8.M3U8,`
Hopefully fix python 3.8 compat 2024-04-23 16:09:30 +00:00			`vods: List[Vod],`
			`targets: List[str],`
Extract playlist parsing code 2024-04-06 08:15:26 +00:00			`) -> m3u8.Playlist:`
			`"""`
			`Make a modified playlist which references downloaded VODs`
			`Keep only the downloaded segments and skip the rest`
			`"""`
			`org_segments = playlist.segments.copy()`

			`path_map = OrderedDict(zip([v.path for v in vods], targets))`
			`playlist.segments.clear()`
			`for segment in org_segments:`
			`if segment.uri in path_map:`
			`segment.uri = path_map[segment.uri]`
			`playlist.segments.append(segment)`

			`return playlist`


Hopefully fix python 3.8 compat 2024-04-23 16:09:30 +00:00			`def select_playlist(playlists: List[Playlist], quality: Optional[str]) -> Playlist:`
Extract playlist parsing code 2024-04-06 08:15:26 +00:00			`return (`
			`select_playlist_by_name(playlists, quality)`
			`if quality is not None`
			`else select_playlist_interactive(playlists)`
			`)`


Hopefully fix python 3.8 compat 2024-04-23 16:09:30 +00:00			`def select_playlist_by_name(playlists: List[Playlist], quality: str) -> Playlist:`
Extract playlist parsing code 2024-04-06 08:15:26 +00:00			`if quality == "source":`
Improve playlist parsing Better support for "enhanced broadcast" streams issue #154 2024-04-27 18:04:40 +00:00			`for playlist in playlists:`
			`if playlist.is_source:`
			`return playlist`
			`raise click.ClickException("Source quality not found, please report an issue on github.")`
Extract playlist parsing code 2024-04-06 08:15:26 +00:00
			`for playlist in playlists:`
Improve playlist parsing Better support for "enhanced broadcast" streams issue #154 2024-04-27 18:04:40 +00:00			`if playlist.name == quality or playlist.group_id == quality:`
Extract playlist parsing code 2024-04-06 08:15:26 +00:00			`return playlist`

			`available = ", ".join([p.name for p in playlists])`
			`msg = f"Quality '{quality}' not found. Available qualities are: {available}"`
			`raise click.ClickException(msg)`


Hopefully fix python 3.8 compat 2024-04-23 16:09:30 +00:00			`def select_playlist_interactive(playlists: List[Playlist]) -> Playlist:`
Extract playlist parsing code 2024-04-06 08:15:26 +00:00			`click.echo("\nAvailable qualities:")`
			`for n, playlist in enumerate(playlists):`
			`if playlist.resolution:`
			`click.echo(f"{n + 1}) {bold(playlist.name)} {dim(f'({playlist.resolution})')}")`
			`else:`
			`click.echo(f"{n + 1}) {bold(playlist.name)}")`

			`no = utils.read_int("Choose quality", min=1, max=len(playlists) + 1, default=1)`
			`playlist = playlists[no - 1]`
			`return playlist`