Karakeep

A comprehensive Grafana dashboard for monitoring Karakeep application performance, including HTTP requests, tRPC operations, queue jobs, and application metrics.

Karakeep Application Monitoring Dashboard

A comprehensive Grafana dashboard for monitoring Karakeep application performance, including HTTP requests, tRPC operations, queue jobs, and application metrics.

📋 Overview

This dashboard provides real-time monitoring and performance analysis of your Karakeep application. Track service health, request performance, queue status, user activity, and resource utilization with detailed insights into both HTTP and tRPC operations.

✨ Features

🎯 Application Health

Service Status: Real-time UP/DOWN monitoring
Total Bookmarks: Current bookmark count
Total Users: Active user tracking
Queue Jobs: Background job monitoring

🌐 HTTP Performance Metrics

Request Count: Rate of HTTP requests over time
Request Duration: Response time analysis
Request Sum: Cumulative request duration
Request Bucket: Distribution of request latencies

🔌 tRPC Monitoring

Request Duration: tRPC operation latency
Request Count: Rate of tRPC calls
Request Sum: Total processing time
Requests Total: Aggregate tRPC operations

📊 Prometheus Scraping Metrics

Scrape Duration: Time taken to scrape metrics
Scrape Samples: Number of metrics collected
Scrape Series Added: New time series tracking
Sample Relabeling: Post-processing metrics

💾 Resource Monitoring

Total Asset Size: Storage utilization in bytes
Queue Status: Background job queue depth

🖼️ Dashboard Structure

The dashboard is organized into four main sections:

Top Row - Key Metrics

Panel	Metric	Description
Status	`up`	Service availability (UP/DOWN)
Total Bookmarks	`karakeep_total_bookmarks`	Current bookmark count
Total Users	`karakeep_total_users`	Total registered users

HTTP Performance Section

Panel	Metric	Type
HTTP Request Count	`karakeep_http_request_duration_seconds_count`	Rate (req/s)
HTTP Request Duration Sum	`karakeep_http_request_duration_seconds_sum`	Seconds
HTTP Request Bucket	`karakeep_http_request_duration_seconds_bucket`	Histogram
HTTP Requests Total	`karakeep_http_requests_total`	Counter

tRPC Operations Section

Panel	Metric	Type
tRPC Request Duration	`karakeep_trpc_request_duration_seconds`	Gauge
tRPC Request Count	`karakeep_trpc_request_duration_seconds_count`	Rate
tRPC Request Sum	`karakeep_trpc_request_duration_seconds_sum`	Seconds
tRPC Requests Total	`karakeep_trpc_requests_total`	Counter

System & Queue Monitoring

Panel	Metric	Description
Queue Jobs	`karakeep_queue_jobs`	Background job count
Total Asset Size	`karakeep_total_asset_size_bytes`	Storage usage
Scrape Duration	`scrape_duration_seconds`	Prometheus scraping time
Scrape Samples	`scrape_samples_scraped`	Metrics collected per scrape

📦 Requirements

Prerequisites

Grafana: Version 12.0 or higher
Prometheus: As data source
Karakeep: Application with Prometheus metrics endpoint

Required Panels

Stat panel
Time series panel

🚀 Installation

Method 1: Import via Grafana UI

Log in to your Grafana instance
Navigate to Dashboards → New → Import
Paste the dashboard JSON or upload the JSON file
Select your Prometheus data source
Click Import

Method 2: Import via Dashboard ID

(If published to Grafana.com)

Navigate to Dashboards → New → Import
Enter the dashboard ID: XXXXX
Click Load
Select your Prometheus data source
Click Import

⚙️ Configuration

Karakeep Metrics Endpoint

Ensure your Karakeep application exposes Prometheus metrics:

# Example application configuration
metrics:
  enabled: true
  port: 9090
  path: /metrics

The metrics endpoint should be accessible at:

http://your-karakeep-instance:9090/metrics

Prometheus Configuration

Add Karakeep as a scrape target in your prometheus.yml:

scrape_configs:
  - job_name: 'karakeep'
    scrape_interval: 15s
    scrape_timeout: 10s
    static_configs:
      - targets: ['karakeep:9090']
    metrics_path: '/metrics'

For multiple Karakeep instances:

scrape_configs:
  - job_name: 'karakeep-production'
    scrape_interval: 15s
    static_configs:
      - targets: 
          - 'karakeep-prod-1:9090'
          - 'karakeep-prod-2:9090'
    relabel_configs:
      - source_labels: [__address__]
        target_label: instance

job_name: 'karakeep-staging'
scrape_interval: 30s
static_configs:

targets: ['karakeep-staging:9090']

Dashboard Variables

The dashboard includes a Job variable that allows filtering by Prometheus job name:

Variable: $job
Query: label_values(karakeep_total_bookmarks, job)
Multi-select: No
Refresh: On dashboard load

This allows you to switch between different Karakeep deployments (production, staging, etc.).

📊 Metrics Reference

Application Metrics

Metric	Description	Type	Unit
`up`	Service health status	Gauge	0/1
`karakeep_total_bookmarks`	Total bookmarks in system	Gauge	count
`karakeep_total_users`	Total registered users	Gauge	count
`karakeep_queue_jobs`	Current queue job count	Gauge	count
`karakeep_total_asset_size_bytes`	Total asset storage used	Gauge	bytes

HTTP Request Metrics

Metric	Description	Type	Unit
`karakeep_http_requests_total`	Total HTTP requests	Counter	count
`karakeep_http_request_duration_seconds_count`	Number of HTTP requests	Counter	count
`karakeep_http_request_duration_seconds_sum`	Total HTTP request time	Counter	seconds
`karakeep_http_request_duration_seconds_bucket`	HTTP request latency histogram	Histogram	seconds

tRPC Metrics

Metric	Description	Type	Unit
`karakeep_trpc_requests_total`	Total tRPC requests	Counter	count
`karakeep_trpc_request_duration_seconds`	tRPC request duration	Gauge	seconds
`karakeep_trpc_request_duration_seconds_count`	Number of tRPC requests	Counter	count
`karakeep_trpc_request_duration_seconds_sum`	Total tRPC request time	Counter	seconds

Prometheus Metrics

Metric	Description	Type	Unit
`scrape_duration_seconds`	Time to scrape target	Gauge	seconds
`scrape_samples_scraped`	Samples scraped per scrape	Gauge	count
`scrape_samples_post_metric_relabeling`	Samples after relabeling	Gauge	count
`scrape_series_added`	New series added	Gauge	count

🎨 Customization

Adjusting Time Windows

Modify the time range for your use case:

// Default: Last 6 hours
"time": {
  "from": "now-6h",
  "to": "now"
}
// For daily analysis
"time": {
"from": "now-24h",
"to": "now"
}
// For weekly trends
"time": {
"from": "now-7d",
"to": "now"
}

Adding Custom Panels

Example: Add a panel for bookmark creation rate:

- title: "Bookmark Creation Rate"
  type: timeseries
  targets:
    - expr: rate(karakeep_total_bookmarks[5m])
      legendFormat: "Creation Rate"

Modifying Status Colors

Edit the Status panel thresholds:

Click on Status panel → Edit
Navigate to Field → Mappings
Adjust colors:
- 0 (DOWN): Red (semi-dark-red)
- 1 (UP): Green (semi-dark-green)

Setting up Alerts

Create alerts based on metrics:

# Example: Alert when service is down
- alert: KarakeepServiceDown
  expr: up{job="karakeep"} == 0
  for: 1m
  annotations:
    summary: "Karakeep service is down"
Example: High request latency

alert: HighRequestLatency
expr: rate(karakeep_http_request_duration_seconds_sum[5m]) > 1
for: 5m
annotations:
summary: "High HTTP request latency detected"

🔧 Troubleshooting

No Data Displayed

Verify metrics endpoint is accessible:
```
curl http://karakeep:9090/metrics
```
Check Prometheus is scraping:
- Go to Prometheus UI → Status → Targets
- Verify karakeep target is UP
- Check for scrape errors

Verify metric names:

# In Prometheus UI, query:
{job="karakeep"}

Status Shows DOWN

If the service appears DOWN but is running:

Check the up metric:
```
up{job="karakeep"}
```
Verify Prometheus can reach the endpoint
Check firewall rules
Review Prometheus logs for connection errors

High Queue Job Count

If queue jobs are accumulating:

Check worker status
Review application logs
Monitor system resources (CPU, memory)
Consider scaling workers

Missing tRPC Metrics

If tRPC panels show no data:

Verify tRPC instrumentation is enabled in Karakeep
Check if tRPC endpoints are being called
Ensure metrics are properly exported

📈 Performance Analysis

Request Rate Analysis

Calculate requests per second:

rate(karakeep_http_requests_total[5m])

Average Response Time

Calculate average HTTP response time:

rate(karakeep_http_request_duration_seconds_sum[5m]) 
/ 
rate(karakeep_http_request_duration_seconds_count[5m])

95th Percentile Latency

histogram_quantile(0.95, 
  rate(karakeep_http_request_duration_seconds_bucket[5m])
)

Queue Processing Rate

Monitor how fast jobs are processed:

rate(karakeep_queue_jobs[5m])

💡 Best Practices

Monitoring Strategy

Baseline Establishment: Run for 1-2 weeks to establish normal patterns
Set Realistic Thresholds: Base alerts on your baseline ±30%
Monitor Trends: Look for gradual degradation over time
Correlate Metrics: Cross-reference HTTP and tRPC metrics

Alert Recommendations

Create alerts for:

Service Down: up == 0 for > 1 minute
High Latency: P95 > 2 seconds for > 5 minutes
Queue Buildup: Queue jobs > 1000 for > 10 minutes
High Error Rate: Error rate > 5% for > 5 minutes
Storage Growth: Asset size increasing > 10% per day

Performance Optimization

Monitor these indicators:

HTTP Request Duration: Should be < 500ms for most endpoints
tRPC Latency: Should be < 200ms for API calls
Queue Jobs: Should trend toward 0 during off-peak hours
Scrape Duration: Should be < 1 second

📝 Use Cases

Development & Debugging

Identify slow endpoints
Monitor request patterns during testing
Track resource usage during development

Production Monitoring

Real-time service health monitoring
Performance regression detection
Capacity planning based on growth trends

Incident Response

Quick identification of performance issues
Historical data for root cause analysis
Correlation between different metrics

Capacity Planning

Track user growth trends
Monitor storage utilization
Plan infrastructure scaling

🤝 Contributing

Contributions are welcome! Areas for enhancement:

Additional application-specific metrics
Custom alert rule templates
Enhanced visualization options
Integration with other monitoring tools

To contribute:

Fork the repository
Create your feature branch
Submit a pull request with clear description

📝 Changelog

Version 1.0.0 (2024)

Initial release
Service health monitoring
HTTP and tRPC metrics
Queue job tracking
User and bookmark statistics
Prometheus scraping metrics
Asset storage monitoring

📄 License

This dashboard is released under the MIT License.

🔗 Links

Documentation

Tools

Community

💬 Support

For issues or questions:

Check Karakeep documentation
Open an issue on GitHub
Visit the Grafana community forums
Review Prometheus metrics troubleshooting guide

🙏 Acknowledgments

Karakeep development team for metrics instrumentation
Prometheus and Grafana communities
Contributors to monitoring best practices

⚠️ Important Notes

Metric Retention

Configure appropriate retention in Prometheus:

# prometheus.yml
storage:
  tsdb:
    retention.time: 30d  # Adjust based on needs
    retention.size: 50GB

Scrape Intervals

Balance between data granularity and resource usage:

Production: 15s interval
Staging: 30s interval
Development: 60s interval

Resource Considerations

Monitor Prometheus resource usage:

CPU: Increases with cardinality
Memory: ~2-3 bytes per time series
Disk: Depends on retention and cardinality

Monitor your Karakeep application effectively! 📊🚀💾

Revisions

Revision	Description	Created
			Download

Get this dashboard

Import the dashboard template

Download JSON

Datasource

Dependencies

Resources

Docs: Importing dashboards Webinar: Getting started with Grafana dashboard design Webinar: Building advanced Grafana dashboards