hp0404/llm_call.py

## llm_call.py
import json
import logging
from datetime import datetime
from typing import Any

from sqlalchemy import create_engine, text

logger = logging.getLogger("llm_logger")

DEFAULT_DATABASE_URL = (
    "CONNECTION_STRING"
)


def llm_call(
    *,
    system_prompt: str | None = None,
    user_message: str | None = None,
    model: str | None = None,
    provider: str | None = None,
    temperature: float = 1.0,
    completion: Any | None = None,
    task: str | None = None,
    completion_type: str | None = None,
    set_daily_max_tokens: int | None = None,  # kept for backwards compatibility, ignored
    is_batched: bool = False,
    database_url: str | None = None,
) -> None:
    """
    Minimal standalone logger for LLM calls.
    Inserts new rows into the existing `llm_interactions` table (no daily limit checks).
    """

    if completion is None:
        raise ValueError("completion must not be None")

    completion_id = getattr(completion, "id", None)
    if completion_id is None:
        raise ValueError("completion object must have an 'id' attribute")

    created_ts = getattr(completion, "created", None)
    if created_ts:
        created_at = datetime.fromtimestamp(created_ts)
    else:
        created_at = datetime.now()

    # Extract token usage
    token_fields = {
        "prompt_tokens": 0,
        "completion_tokens": 0,
        "total_tokens": 0,
        "prompt_tokens_cached": 0,
        "prompt_tokens_audio": 0,
        "completion_tokens_reasoning": 0,
        "completion_tokens_audio": 0,
        "completion_tokens_accepted": 0,
        "completion_tokens_rejected": 0,
    }

    usage = getattr(completion, "usage", None)
    if usage is not None:
        token_fields["prompt_tokens"] = getattr(usage, "prompt_tokens", 0) or 0
        token_fields["completion_tokens"] = getattr(usage, "completion_tokens", 0) or 0
        token_fields["total_tokens"] = getattr(usage, "total_tokens", 0) or 0

        prompt_details = getattr(usage, "prompt_tokens_details", None)
        if prompt_details is not None:
            token_fields["prompt_tokens_cached"] = (
                getattr(prompt_details, "cached_tokens", 0) or 0
            )
            token_fields["prompt_tokens_audio"] = (
                getattr(prompt_details, "audio_tokens", 0) or 0
            )

        completion_details = getattr(usage, "completion_tokens_details", None)
        if completion_details is not None:
            token_fields["completion_tokens_reasoning"] = (
                getattr(completion_details, "reasoning_tokens", 0) or 0
            )
            token_fields["completion_tokens_audio"] = (
                getattr(completion_details, "audio_tokens", 0) or 0
            )
            token_fields["completion_tokens_accepted"] = (
                getattr(completion_details, "accepted_prediction_tokens", 0) or 0
            )
            token_fields["completion_tokens_rejected"] = (
                getattr(completion_details, "rejected_prediction_tokens", 0) or 0
            )

    # Provider / model / task / completion_type defaults
    provider = "kaggle"

    if completion_type is None:
        completion_type = getattr(completion, "object", "chat")

    if model is None:
        model_val = getattr(completion, "model", None)
        if model_val is None:
            raise ValueError("Either 'model' argument or completion.model must be set")
        model = str(model_val)
        if "/" not in model:
            model = f"openai/{model}"

    if task is None:
        task = "chat_completion"

    user_message_db = user_message or ""

    # Convert completion object to JSON-serialisable dict for JSONB
    if hasattr(completion, "model_dump"):
        completion_dict = completion.model_dump()
    elif hasattr(completion, "dict"):
        completion_dict = completion.dict()
    elif isinstance(completion, dict):
        completion_dict = completion
    else:
        completion_dict = {
            k: getattr(completion, k)
            for k in dir(completion)
            if not k.startswith("_")
            and not callable(getattr(completion, k))
        }

    completion_json = json.dumps(completion_dict)

    db_url = database_url or os.getenv("LLMLOGER_DATABASE_URL", DEFAULT_DATABASE_URL)
    engine = create_engine(db_url)

    try:
        with engine.begin() as conn:
            # Duplicate check
            exists = conn.execute(
                text(
                    "SELECT 1 FROM llm_interactions "
                    "WHERE completion_id = :cid LIMIT 1"
                ),
                {"cid": completion_id},
            ).scalar()

            if exists:
                logger.debug(
                    "Skipping duplicate LLM interaction with ID %s", completion_id
                )
                return

            params = {
                "completion_id": completion_id,
                "completion_type": completion_type,
                "task": task,
                "model": model,
                "provider": provider,
                "temperature": float(temperature),
                "system_message": system_prompt,
                "user_message": user_message_db,
                "created_at": created_at,
                "completion": completion_json,
                "is_batched": bool(is_batched),
                "error": None,
                **token_fields,
            }

            conn.execute(
                text(
                    """
                    INSERT INTO llm_interactions (
                        completion_id,
                        completion_type,
                        task,
                        model,
                        provider,
                        temperature,
                        system_message,
                        user_message,
                        created_at,
                        completion,
                        prompt_tokens,
                        completion_tokens,
                        total_tokens,
                        prompt_tokens_cached,
                        prompt_tokens_audio,
                        completion_tokens_reasoning,
                        completion_tokens_audio,
                        completion_tokens_accepted,
                        completion_tokens_rejected,
                        error,
                        is_batched
                    )
                    VALUES (
                        :completion_id,
                        :completion_type,
                        :task,
                        :model,
                        :provider,
                        :temperature,
                        :system_message,
                        :user_message,
                        :created_at,
                        CAST(:completion AS jsonb),
                        :prompt_tokens,
                        :completion_tokens,
                        :total_tokens,
                        :prompt_tokens_cached,
                        :prompt_tokens_audio,
                        :completion_tokens_reasoning,
                        :completion_tokens_audio,
                        :completion_tokens_accepted,
                        :completion_tokens_rejected,
                        :error,
                        :is_batched
                    )
                    """
                ),
                params,
            )

            logger.debug("Logged LLM interaction with ID %s", completion_id)

    except Exception:
        logger.error("Failed to log LLM interaction", exc_info=True)
        raise
	import json
	import logging
	from datetime import datetime
	from typing import Any

	from sqlalchemy import create_engine, text

	logger = logging.getLogger("llm_logger")

	DEFAULT_DATABASE_URL = (
	"CONNECTION_STRING"
	)


	def llm_call(
	*,
	system_prompt: str \| None = None,
	user_message: str \| None = None,
	model: str \| None = None,
	provider: str \| None = None,
	temperature: float = 1.0,
	completion: Any \| None = None,
	task: str \| None = None,
	completion_type: str \| None = None,
	set_daily_max_tokens: int \| None = None, # kept for backwards compatibility, ignored
	is_batched: bool = False,
	database_url: str \| None = None,
	) -> None:
	"""
	Minimal standalone logger for LLM calls.
	Inserts new rows into the existing `llm_interactions` table (no daily limit checks).
	"""

	if completion is None:
	raise ValueError("completion must not be None")

	completion_id = getattr(completion, "id", None)
	if completion_id is None:
	raise ValueError("completion object must have an 'id' attribute")

	created_ts = getattr(completion, "created", None)
	if created_ts:
	created_at = datetime.fromtimestamp(created_ts)
	else:
	created_at = datetime.now()

	# Extract token usage
	token_fields = {
	"prompt_tokens": 0,
	"completion_tokens": 0,
	"total_tokens": 0,
	"prompt_tokens_cached": 0,
	"prompt_tokens_audio": 0,
	"completion_tokens_reasoning": 0,
	"completion_tokens_audio": 0,
	"completion_tokens_accepted": 0,
	"completion_tokens_rejected": 0,
	}

	usage = getattr(completion, "usage", None)
	if usage is not None:
	token_fields["prompt_tokens"] = getattr(usage, "prompt_tokens", 0) or 0
	token_fields["completion_tokens"] = getattr(usage, "completion_tokens", 0) or 0
	token_fields["total_tokens"] = getattr(usage, "total_tokens", 0) or 0

	prompt_details = getattr(usage, "prompt_tokens_details", None)
	if prompt_details is not None:
	token_fields["prompt_tokens_cached"] = (
	getattr(prompt_details, "cached_tokens", 0) or 0
	)
	token_fields["prompt_tokens_audio"] = (
	getattr(prompt_details, "audio_tokens", 0) or 0
	)

	completion_details = getattr(usage, "completion_tokens_details", None)
	if completion_details is not None:
	token_fields["completion_tokens_reasoning"] = (
	getattr(completion_details, "reasoning_tokens", 0) or 0
	)
	token_fields["completion_tokens_audio"] = (
	getattr(completion_details, "audio_tokens", 0) or 0
	)
	token_fields["completion_tokens_accepted"] = (
	getattr(completion_details, "accepted_prediction_tokens", 0) or 0
	)
	token_fields["completion_tokens_rejected"] = (
	getattr(completion_details, "rejected_prediction_tokens", 0) or 0
	)

	# Provider / model / task / completion_type defaults
	provider = "kaggle"

	if completion_type is None:
	completion_type = getattr(completion, "object", "chat")

	if model is None:
	model_val = getattr(completion, "model", None)
	if model_val is None:
	raise ValueError("Either 'model' argument or completion.model must be set")
	model = str(model_val)
	if "/" not in model:
	model = f"openai/{model}"

	if task is None:
	task = "chat_completion"

	user_message_db = user_message or ""

	# Convert completion object to JSON-serialisable dict for JSONB
	if hasattr(completion, "model_dump"):
	completion_dict = completion.model_dump()
	elif hasattr(completion, "dict"):
	completion_dict = completion.dict()
	elif isinstance(completion, dict):
	completion_dict = completion
	else:
	completion_dict = {
	k: getattr(completion, k)
	for k in dir(completion)
	if not k.startswith("_")
	and not callable(getattr(completion, k))
	}

	completion_json = json.dumps(completion_dict)

	db_url = database_url or os.getenv("LLMLOGER_DATABASE_URL", DEFAULT_DATABASE_URL)
	engine = create_engine(db_url)

	try:
	with engine.begin() as conn:
	# Duplicate check
	exists = conn.execute(
	text(
	"SELECT 1 FROM llm_interactions "
	"WHERE completion_id = :cid LIMIT 1"
	),
	{"cid": completion_id},
	).scalar()

	if exists:
	logger.debug(
	"Skipping duplicate LLM interaction with ID %s", completion_id
	)
	return

	params = {
	"completion_id": completion_id,
	"completion_type": completion_type,
	"task": task,
	"model": model,
	"provider": provider,
	"temperature": float(temperature),
	"system_message": system_prompt,
	"user_message": user_message_db,
	"created_at": created_at,
	"completion": completion_json,
	"is_batched": bool(is_batched),
	"error": None,
	**token_fields,
	}

	conn.execute(
	text(
	"""
	INSERT INTO llm_interactions (
	completion_id,
	completion_type,
	task,
	model,
	provider,
	temperature,
	system_message,
	user_message,
	created_at,
	completion,
	prompt_tokens,
	completion_tokens,
	total_tokens,
	prompt_tokens_cached,
	prompt_tokens_audio,
	completion_tokens_reasoning,
	completion_tokens_audio,
	completion_tokens_accepted,
	completion_tokens_rejected,
	error,
	is_batched
	)
	VALUES (
	:completion_id,
	:completion_type,
	:task,
	:model,
	:provider,
	:temperature,
	:system_message,
	:user_message,
	:created_at,
	CAST(:completion AS jsonb),
	:prompt_tokens,
	:completion_tokens,
	:total_tokens,
	:prompt_tokens_cached,
	:prompt_tokens_audio,
	:completion_tokens_reasoning,
	:completion_tokens_audio,
	:completion_tokens_accepted,
	:completion_tokens_rejected,
	:error,
	:is_batched
	)
	"""
	),
	params,
	)

	logger.debug("Logged LLM interaction with ID %s", completion_id)

	except Exception:
	logger.error("Failed to log LLM interaction", exc_info=True)
	raise
No results found